异构计算开发工程师
3-5万元/月
投递简历
浙江-杭州
3-5年
Golang · 调度 · Docker · ai+infra · gpu · Kubernetes
2025-12-16 18:30:34 更新
被浏览:942 次
阿里云计算有限公司
最近在线时间:2025-12-16 18:30:34
电话:186********
地址:浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
职位描述
职位描述:
1.深入掌握主流AI芯片架构,分析硬件系统设计,输出软硬件协同优化方案及性能调优实践指导;
2.理解AI、大数据与HPC类应用在异构计算环境下的技术挑战,结合AI加速芯片能力,构建高性能异构计算解决方案;
3.专注异构资源的实时性能监控与分析,主导系统层级的性能评估与业务瓶颈识别,保障异构集群的高可用性;
4.推进异构计算基础设施向serverless架构演进,支撑云原生异构计算体系的技术升级;
5.把握人工智能与深度学习应用的发展方向,参与未来机器学习算力平台的规划与设计;
职位要求
1.具备扎实的编程基础,熟练掌握C/C++/Go/Rust等语言,具备良好的工程化开发规范;
2.精通Linux操作系统原理,具备大规模生产级系统软件的研发与运维经历;
3.具备大型GPU集群的监控体系搭建、性能剖析(profiling)与资源调度实践经验;
4.熟悉异构计算编程模型,了解主流AI加速芯片(如NVIDIA,AMD等)的架构设计与计算特性;
5.熟悉Kubernetes架构与编程模式,有容器化技术的实际项目落地经验;
6.能够阅读英文技术文档,计算机相关专业学历,具备5年及以上云计算或AI基础设施研发经历。
优先考虑:
1.具备GPU驱动开发背景者优先;
2.参与过GPU稳定性保障体系建设者优先;
3.具备GPU热迁移功能开发者优先;
4.有大规模GPU集群监控、在线性能分析及稳定性维护经验者优先;
5.有Kubernetes二次开发或异构资源调度开发经验者优先;
6.熟悉docker/containerd/runc组件,具备OCIHook开发经验者优先;
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
您可能感兴趣的职位
搜索更多相似职位 >
推荐企业
职位专题
微信求职找工作
手机扫一扫
随时随地找工作