AI智算集群运维管控与计算资源调度平台研发专家
3-6万元/月
投递简历
北京-朝阳区
5-10年
Golang · 云原生 · Java · C/C++ · kubernetes
2025-12-14 14:16:51 更新
被浏览:524 次
阿里云计算有限公司
最近在线时间:2025-12-14 14:16:51
电话:175********
地址:浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
职位描述
1.构建灵骏监管控系统的核心能力,持续提升客户在云环境使用灵骏智算集群产品的自动化与智能化水平。
2.打造涵盖智算集群库存管理、节点调度、性能分析、故障自动处理及租户运维等功能的体系化能力,不断增强灵骏智算集群产品的市场竞争力。
3.完善系统高可用架构,包括管控组件故障自动识别与恢复、自适应容灾机制、云原生技术的实施与落地,保障业务连续性及线上系统的稳定运行。
4.构建异构算力统一管理与资源调度平台,持续优化智算集群资源利用效率,降低整体计算成本。
5.密切跟踪AI智算、云原生及智能运维领域的前沿技术,结合实际业务场景推动技术创新与应用。
6.本岗位需承担值班任务,依照服务级别协议(SLA)要求及时响应客户需求,推进问题闭环,提升客户满意度。
职位要求
1.具备5年以上大规模分布式系统设计与开发经验,曾独立主导多模块业务子系统建设,涵盖接口规范制定、架构设计及关键分布式技术方案的落地实施。
2.编程基础扎实,熟练掌握数据结构与算法,精通Golang/Java/Python/C++中至少一门开发语言。
3.系统工程能力突出,具备强烈的线上稳定性意识,对复杂系统有较强的技术洞察力和故障排查能力;具备线上监控体系、变更流程设计与研发经验者优先。
4.业务理解力强,具备优秀的抽象建模能力,逻辑清晰,善于独立思考与问题分析,能够主导端到端技术产品项目者优先。
5.具备复杂项目的统筹管理能力,有项目负责人或研发团队对接人经历者优先。
6.具备良好的团队协作意识,有实线或虚线带领团队完成技术项目的经验者优先。
7.熟悉AI框架、云原生架构、微服务设计理念及常用设计模式者优先。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
您可能感兴趣的职位
搜索更多相似职位 >
推荐企业
职位专题
微信求职找工作
手机扫一扫
随时随地找工作