AI软硬件融合高级研发工程师
5-8万元/月
投递简历
北京-朝阳区
3-5年
编译器开发经验 · cuda · C++ · C · 分布式经验 · OpenGL · Redis · 算子优化 · Python
2025-12-14 10:02:43 更新
被浏览:439 次
阿里云计算有限公司
最近在线时间:2025-12-14 10:02:43
电话:158********
地址:浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
职位描述
职位描述
1.深入理解主流AI芯片与服务器架构,分析硬件加速特性及内部拓扑结构,输出可行的硬件优化方案与调优指导,最大化释放硬件性能潜力。
2.结合主流LLM推理框架(如sglang/vLLM)以及大模型结构和计算特点,通过软硬件协同设计与技术创新(涵盖硬件算子优化、显存管理、并行策略等),完成新服务器平台端到端性能评估与深度优化。
3.提供面向具体应用场景的定制化优化能力,精准识别大模型在各类业务场景中的性能瓶颈,快速制定并落地满足实际需求的性能提升方案。
4.熟练掌握系统级调优与Profiling工具(如nsys/ncu系列、Perf、火焰图等),具备系统性能分析与瓶颈定位能力,能结合硬件特征进行软件层适配与优化。
职位要求
1.熟悉sglang/vLLM/Pytorch等主流LLM推理框架,具备二次开发或深度优化经验(包括KVCache优化、编译优化、Speculative执行、量化、DeepEP等相关技术)。
2.具备良好的沟通协作与项目推动能力,能够与跨背景团队高效协同。
如下经验优先:
1.具备性能调优实践经历,有在新硬件平台上完成sglang/vLLM适配与优化的经验,尤其是对Qwen/DeepSeek类模型进行过性能优化者优先
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
您可能感兴趣的职位
搜索更多相似职位 >
推荐企业
职位专题
微信求职找工作
手机扫一扫
随时随地找工作