监控开发、运维、运维开发-多P-杭州/北
3.5-6.5万元/月【阿里云智能-基础平台开发工程师/高级工程师-云内监控-杭州/北京】
职位描述
1.熟悉系统运行逻辑、上下游依赖及业务流程,能独立高效解决常见的线上问题
2.根据具体需求,独立负责某一功能模块的工程设计及合理抽象建模,采用合理的技术选型,编写高质量代码实现,保障交付。
3.从业务支持工作中,能够识别问题,提出改进方案并落地实现。
4.从稳定、安全、高效等角度做好其负责组件设计,在实现神农对阿里云可观测的同时,保持自身系统的可观测。
5.从横向沟通、工单和业务支持中,发现客户痛点,并主动寻找解决方案。
职位要求
1.3年以上后端或客户端研发经验。
2.对云原生有一定了解,熟悉常用的云原生技术。
3.熟悉常用的可观测(监控)工具
二.专业技能:
1.掌握C++/C/JAVA/Go某种语言,理解该语言的底层核心和常用框架。
2.熟悉虚拟化、容器、容器编排技术,对k8s有深度掌握和丰富经验。
3.熟悉常用设计模式,熟悉分布式架构设计,熟悉消息、缓存、负载均衡、RPC等机制。
4.熟悉k8s,在k8s上有丰富经验。
5.了解Linux系统,知道Linux内核基本原理。
6.熟练掌握JAVA编程技术、并发,主流开源应用框架和中间件,如Spring、SpringBoot、mysql、redis、MQ等;
7.5)和6)至少满足一项
8.较强的代码能力,与开发规范意识,扎实的技术功底。
【阿里云智能-API网关研发工程师/高级工程师-开放平台-北京】
职位描述
阿里云API网关是阿里云管控API的入口,每天处理数以百亿计的请求。提供稳定、安全、高可用、可扩展的阿里云API网关对用户至关重要。阿里云API网关作为管控侧的统一网关,同时也集成了流量控制、访问和权限控制、审计、监控等各种横向能力,需要让这些能力稳定、高效的生长在网关上。
作为阿里云开放API-API网关团队的一员,你将迎接巨大规模和复杂性的挑战,跟团队一起以技术的方式解决难题、提升API网关的稳定性、安全性、可用性和可扩展性。阿里云API网关上承载了上百款云产品、上万个对外开放的管控API、以及百亿级别的日调用量。你需要对网关做体系化的设计和建设,兼顾稳定安全和效率,用业界的最佳实践打好地基。除此之外,你也需要善于跟其他云产品团队打交道,理解他们的场景和需求,以平台的思维推动阿里云统一网关的建设。
我们希望寻找一名有丰富后端研发经验、对技术有热情、注重工程质量和最佳实践的候选人加入到我们的团队!在阿里云API网关团队,你将服务阿里云用户海量的管控API请求,提供流量控制、访问控制、审计、监控等核心横向能力,做好阿里云API的“看门人”。我们相信,随着云计算技术的不断发展,它将会像水电煤一样成为社会的基础设施,为人们带来更多的便利和创新。作为阿里云开放API-API网关团队的一员,你将加入到一个充满使命感、热情激昂、不畏艰难的团队。诚挚期待你的加入,跟我们一起并肩作战,为用户提供无法计算的价值!
职位要求
●计算机相关专业本科及以上学历;
●3年及以上的后端研发经验、其中至少1年以上是网关或相关领域的经验;
●熟悉网络、分布式系统、API网关相关的知识,对复杂系统设计、分布式系统设计、可演进的架构设计有丰富的实战经验;
●熟悉工程的最佳实践、能在日常工作中贯彻推行代码设计、代码测试、代码评审、CI/CD、部署运维等方面的最佳实践;
●有AWS、Azure、GCP工作经验和国际化视野者优先,善于不断学习和自我提升。
【阿里云智能-高级开发工程师-系统-北京/杭州】
职位描述
1、技术方案设计
•收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果
•基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、技术架构、数据架构和开发流程
2、技术实现
•基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现
•对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署
•对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等
3、基础服务开发
•洞察和抽象团队内的共性技术需求并形成基础服务技术方案
•通过技术框架、技术领域SDK、web组件库、技术知识库等可复用能力的建设,不断提升团队研发效率和质量
4、技术洞察与研究
•通过行业会议、技术媒体、学术研究、友商交流等方式,收集领域内的最新技术信息,包括但不限于技术原理、技术优劣势、应用场景等
•追踪并定期分析竞对产品的核心技术指标和发展方向
•通过内外部渠道,了解并洞悉客户需求,并凝练形成对应的技术洞察
5、技术规划
•基于业务需求和技术洞察,制定技术团队的中长期发展规划和技术路线图
•体系性的设计各类配套规划,包括技术人员规划、技术基础设施规划、技术质量规划、技术安全规划等
6、项目管理
•确定项目目标和范围,并拟定项目计划、预算和资源需求计划、项目风险评估、交付成果等
•组建项目团队,明确项目各岗位职责和任务,配备必要的资源,并设计高效的协作机制
•按项目计划进行落地实施,并对项目进度、数据、质量进行监控,确保项目保质保量实施
•总结项目经验和教训,反馈项目成果和绩效,为之后的项目管理沉淀经验总结
职位要求
•3年以上应用开发经验
•参与过完整的应用项目开发
•熟悉技术领域相关的前沿信息渠道,定期形成相关的前沿研究文档沉淀并能在团队中进行技术分享
•熟悉竞对和对标产品的核心技术指标、优劣势对比,对我们如何追赶和保持优势有一定的理解
•通过POC、产品经理、PDSA等内外部渠道理解客户诉求,并能结合自己的技术理解形成有价值的洞见
•独立负责多个技术模块或全部模块并可参与团队内或跨团队项目
•能够理解复杂度适中的业务需求和技术需求的关联性,做出合理的技术选型判断,并独立完成产品功能/相应SDK的技术方案设计
•能够负责一个大型项目的子模块开发职责,并提供高质量的代码产出和文档沉淀,积极参与推动codereview,提交代码前完成自测,对技术领域基本原理有深刻理解,同时具备一定技术攻坚能力,同时具备一定技术攻坚能力,能够解决单点复杂技术问题和工单(如一个较为复杂业务的性能优化、一个较低概率出现的稳定性问题)
•具备较强的风险意识,能准确识别、暴露风险,并且推动风险得到有效解决
•子系统研发安全生产执行者
•具备较强的研发安全生产意识,熟悉所负责子模块、子系统以及横向关联子模块、子系统的安全生产风险及预防措施,能够处置和恢复较复杂的安全和稳定性故障
•在所负责的子模块、子系统的全链路研发流程中(需求理解、设计、测试、发布、运维)上严格遵循研发安全生产规范,保障系统的安全和稳定
•具备参与研发安全演练的技术能力
•熟悉系统使用场景,能根据业务场景设计系统的能力,抽象功能需求,优化性能
•对关联业务、业务发展、行业产品有基本了解
•正确认知所在技术模块的业务定位
•具备和业务或者团队内外的上下游产品的互动能力,能够主动理解任务/需求与团队和项目其他人工作之间关系
•初步具备中等复杂度项目的管理能力
有良好的英语能力,英语能作为工作语言优先
【阿里云智能-运维专家-云平台运维】
职位描述
1、负责阿里云大数据产品,Maxcompute的产品运维工作,包括服务稳定性体系建设、资源成本优化与运维效率提升等工作内容;
2、负责大数据运维平台ABM里对应产品运维功能的设计和开发,在运维中台能力之上,用软件工程和AI技术提升运维质量及效率;
3、负责重大技术项目的组织、方案制定及整体协调,如架构改进、集群部署、大促重保等,保障项目的有效落地并获得技术和业务上的收益价值。
职位要求
1、计算机或相关专业,3-5年及以上行业内的技术岗位和系统架构经验,熟悉大数据自研平台架构和技术体系者优先;
2、具备大型分布式系统的开发/运维、大型系统运维管控平台的开发/设计背景;
3、精通Linux系统,具备系统级问题troubleshooting和performancetuning能力者优先;
4、具备云原生技术能力和大规模云原生生产保障经验优先;
5、具有扎实的编程基础,熟练使用至少一门主流语言:Python/Go/Java,熟悉常见的python/java后台开发框架优先