AI与异构计算研发及运维-北京/上海/杭州
4.5-7.5万元/月
投递简历
北京-朝阳区
5-10年
Golang · cuda · Shell · rdma · 异构 · gpu · Python · 高性能
2025-12-17 05:54:29 更新
被浏览:222 次
阿里云计算有限公司
最近在线时间:2025-12-17 05:54:29
电话:134********
地址:浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
职位描述
职位描述
1.负责灵骏集群AI系统的性能评估与调优,支撑客户多样化的AI任务场景及不同规模集群运行,精准定位性能瓶颈并制定有效优化策略;
2.面向主流深度学习框架、分布式训练流程及模型部署环境,开展系统级性能优化,提升算子执行效率、通信效率和内存使用率等核心指标,增强集群整体处理能力;
3.构建AI系统性能模型与仿真体系,搭建Roofline等分析工具,利用模拟结果指导系统架构设计与资源规划,为集群建设提供量化依据;同时输出最优训练与部署配置建议,帮助用户实现高性能实践目标;
4.主导性能分析工具的研发与迭代,实现对系统性能的持续监控、瓶颈识别和优化效果验证,输出专业分析报告,为团队及客户提供有力的技术支持与优化方案。
职位要求
1.掌握深度学习框架(如PyTorch)及分布式训练技术(如DeepSpeed、FSDP、Megatron、NCCL);
2.熟悉常用AI系统性能分析工具(如Nsight、PyTorchProfiler等);
3.具备性能建模与仿真背景,了解Roofline模型等典型性能分析方法;
4.熟悉CUDA、OpenCL等并行计算架构,在多模态生成式AI场景下有性能优化经验,具备GPU/PPU调优能力者优先。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
您可能感兴趣的职位
搜索更多相似职位 >
推荐企业
职位专题
微信求职找工作
手机扫一扫
随时随地找工作