异构计算软硬件协同高级研发工程师
5-8万元/月
投递简历
广东-深圳
3-5年
C++ · C · 分布式经验 · PostgreSQL · Redis · 架构设计经验 · Linux开发/部署经验 · Python
2025-12-14 10:03:14 更新
被浏览:824 次
阿里云计算有限公司
最近在线时间:2025-12-14 10:03:14
电话:150********
地址:浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
职位描述
职位描述
1.深入理解主流AI芯片与服务器架构,剖析硬件加速特性及内部拓扑结构,输出硬件优化实践方案与调优指导,充分释放硬件性能潜力。
2.结合主流LLM推理框架(如sglang/vLLM)以及大模型结构与计算特征,通过软硬件协同创新(包括硬件算子优化、显存管理、并行化策略等),主导新服务器平台的端到端性能分析与优化工作。
3.提供面向具体场景的定制化优化能力,精准识别大模型在各类业务环境中的性能瓶颈,快速制定并落地满足实际需求的性能提升方案。
4.熟练掌握系统级调优与Profiling工具(如nsys/ncu系列、Perf、火焰图等),具备系统性能深度分析与瓶颈定位能力,并能结合硬件特性完成软件层面的适配与优化。
5.跟踪大模型技术发展趋势,结合硬件Profiling与Trace数据,为下一代AI基础设施的服务器架构设计与研发提供量化、可落地的数据分析支撑。
职位要求
1.掌握主流AI加速芯片(如NVIDIA、AMD、寒武纪/DCU等)的体系结构、指令集与计算特点,具有异构计算环境下开发与性能调优实战经验。
2.熟悉sglang/vLLM/Pytorch等主流LLM推理框架,具备框架二次开发或深度优化经验(如KVCache优化、编译优化、Speculative执行、量化、DeepEP等技术)。
3.具备优秀的沟通协作与项目统筹能力,能够与跨专业团队高效协同,推动项目有序开展,保障任务按时高质量交付。
如下经验优先:
1.具备sglang/vLLM在新硬件上的适配与优化经验,有针对Qwen/DeepSeek等模型进行性能调优者优先
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
您可能感兴趣的职位
搜索更多相似职位 >
推荐企业
职位专题
微信求职找工作
手机扫一扫
随时随地找工作