您当前的位置: 首页 > 职位列表 > 职位详情

AI软硬件融合高级研发工程师

5-8万元/月
投递简历
北京-朝阳区
3-5年 编译器开发经验 · cuda · C++ · C · 分布式经验 · OpenGL · Redis · 算子优化 · Python
2025-12-14 10:02:43 更新 被浏览:439 次
阿里云计算有限公司
最近在线时间:2025-12-14 10:02:43
电话:158********
地址:浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
职位描述

职位描述
1.深入理解主流AI芯片与服务器架构,分析硬件加速特性及内部拓扑结构,输出可行的硬件优化方案与调优指导,最大化释放硬件性能潜力。
2.结合主流LLM推理框架(如sglang/vLLM)以及大模型结构和计算特点,通过软硬件协同设计与技术创新(涵盖硬件算子优化、显存管理、并行策略等),完成新服务器平台端到端性能评估与深度优化。
3.提供面向具体应用场景的定制化优化能力,精准识别大模型在各类业务场景中的性能瓶颈,快速制定并落地满足实际需求的性能提升方案。
4.熟练掌握系统级调优与Profiling工具(如nsys/ncu系列、Perf、火焰图等),具备系统性能分析与瓶颈定位能力,能结合硬件特征进行软件层适配与优化。

职位要求
1.熟悉sglang/vLLM/Pytorch等主流LLM推理框架,具备二次开发或深度优化经验(包括KVCache优化、编译优化、Speculative执行、量化、DeepEP等相关技术)。
2.具备良好的沟通协作与项目推动能力,能够与跨背景团队高效协同。

如下经验优先:
1.具备性能调优实践经历,有在新硬件平台上完成sglang/vLLM适配与优化的经验,尤其是对Qwen/DeepSeek类模型进行过性能优化者优先

求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
阿里云-专有云稳定性架构师-北京/杭州
3-5万元/月
北京-朝阳区
2025-12-14 15:00:47
投递简历
解决方案架构师(汽车)(AI智能出行方向)
3-6万元/月
北京-朝阳区
2025-12-14 14:54:52
投递简历
容器与Kubernetes资深研发工程师
3.5-6.5万元/月
广东-深圳
2025-12-14 14:18:02
投递简历
AI智算集群运维管控与计算资源调度平台研发专家
3-6万元/月
北京-朝阳区
2025-12-14 14:16:51
投递简历
资深安全工程师
3-5万元/月
北京-朝阳区
2025-12-14 14:16:30
投递简历
阿里云文件存储技术专家
4-7万元/月
上海-徐汇区
2025-12-14 13:56:17
投递简历
阿里云智能-IDC数据中心运维专家-张北
2.5-4万元/月
河北-张家口
2025-12-14 13:12:29
投递简历
阿里云智能-后端开发-AI编程
3.5-5万元/月
浙江-杭州
2025-12-14 13:07:51
投递简历
阿里云智能-云平台运维专家-杭州
2-4万元/月
浙江-杭州
2025-12-14 13:07:47
投递简历
阿里云智能-弹性计算技术架构师-杭州
4-7万元/月
浙江-杭州
2025-12-14 13:04:57
投递简历
您可能感兴趣的职位 搜索更多相似职位 >
推荐企业 职位专题
阿里云计算有限公司
公司主页 >
微信求职找工作
手机扫一扫
手机扫一扫
随时随地找工作

海量高薪岗位在线免费直招 招聘者/求职者电话直聊

微信小程序
手机也能找工作