您当前的位置: 首页 > 职位列表 > 职位详情

异构计算软硬件协同高级研发工程师

5-8万元/月
投递简历
广东-深圳
3-5年 C++ · C · 分布式经验 · PostgreSQL · Redis · 架构设计经验 · Linux开发/部署经验 · Python
2025-12-14 10:03:14 更新 被浏览:824 次
阿里云计算有限公司
最近在线时间:2025-12-14 10:03:14
电话:150********
地址:浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
职位描述

职位描述
1.深入理解主流AI芯片与服务器架构,剖析硬件加速特性及内部拓扑结构,输出硬件优化实践方案与调优指导,充分释放硬件性能潜力。
2.结合主流LLM推理框架(如sglang/vLLM)以及大模型结构与计算特征,通过软硬件协同创新(包括硬件算子优化、显存管理、并行化策略等),主导新服务器平台的端到端性能分析与优化工作。
3.提供面向具体场景的定制化优化能力,精准识别大模型在各类业务环境中的性能瓶颈,快速制定并落地满足实际需求的性能提升方案。
4.熟练掌握系统级调优与Profiling工具(如nsys/ncu系列、Perf、火焰图等),具备系统性能深度分析与瓶颈定位能力,并能结合硬件特性完成软件层面的适配与优化。
5.跟踪大模型技术发展趋势,结合硬件Profiling与Trace数据,为下一代AI基础设施的服务器架构设计与研发提供量化、可落地的数据分析支撑。

职位要求
1.掌握主流AI加速芯片(如NVIDIA、AMD、寒武纪/DCU等)的体系结构、指令集与计算特点,具有异构计算环境下开发与性能调优实战经验。
2.熟悉sglang/vLLM/Pytorch等主流LLM推理框架,具备框架二次开发或深度优化经验(如KVCache优化、编译优化、Speculative执行、量化、DeepEP等技术)。
3.具备优秀的沟通协作与项目统筹能力,能够与跨专业团队高效协同,推动项目有序开展,保障任务按时高质量交付。

如下经验优先:
1.具备sglang/vLLM在新硬件上的适配与优化经验,有针对Qwen/DeepSeek等模型进行性能调优者优先

求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
阿里云-专有云稳定性架构师-北京/杭州
3-5万元/月
北京-朝阳区
2025-12-14 15:00:47
投递简历
解决方案架构师(汽车)(AI智能出行方向)
3-6万元/月
北京-朝阳区
2025-12-14 14:54:52
投递简历
容器与Kubernetes资深研发工程师
3.5-6.5万元/月
广东-深圳
2025-12-14 14:18:02
投递简历
AI智算集群运维管控与计算资源调度平台研发专家
3-6万元/月
北京-朝阳区
2025-12-14 14:16:51
投递简历
资深安全工程师
3-5万元/月
北京-朝阳区
2025-12-14 14:16:30
投递简历
阿里云文件存储技术专家
4-7万元/月
上海-徐汇区
2025-12-14 13:56:17
投递简历
阿里云智能-IDC数据中心运维专家-张北
2.5-4万元/月
河北-张家口
2025-12-14 13:12:29
投递简历
阿里云智能-后端开发-AI编程
3.5-5万元/月
浙江-杭州
2025-12-14 13:07:51
投递简历
阿里云智能-云平台运维专家-杭州
2-4万元/月
浙江-杭州
2025-12-14 13:07:47
投递简历
阿里云智能-弹性计算技术架构师-杭州
4-7万元/月
浙江-杭州
2025-12-14 13:04:57
投递简历
您可能感兴趣的职位 搜索更多相似职位 >
推荐企业 职位专题
阿里云计算有限公司
公司主页 >
微信求职找工作
手机扫一扫
手机扫一扫
随时随地找工作

海量高薪岗位在线免费直招 招聘者/求职者电话直聊

微信小程序
手机也能找工作