大模型推理开发工程师
3-6万元/月
投递简历
北京-海淀区
5-10年
2025-12-10 14:02:59 更新
被浏览:331 次
深圳市拓驰人力资源有限公司
最近在线时间:2025-12-10 14:02:59
电话:134********
地址:深圳市南山区南头街道大汪山社区桃园路8号田厦国际中心A座2905
职位描述
岗位职责:
1.负责大模型推理框架在AI芯片平台上的架构设计、开发和维护,构建高效、低延迟的推理流水线。
2.分析大模型的推理特点,结合芯片架构,设计适配的软硬件协同优化方案。
3.跟踪大模型推理、编译器优化、硬件加速等领域的最新技术动态,持续改进产品性能;
4.熟悉深度学习及推理框架(如PyTorch、VLLM等)的工作原理与应用;
5.熟悉AI芯片架构及底层硬件原理,了解并行计算、异构计算、分布式系统等相关知识;
6.有大规模分布式推理或高性能算子开发、优化经验者优先。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
您可能感兴趣的职位
搜索更多相似职位 >
推荐企业
职位专题
微信求职找工作
手机扫一扫
随时随地找工作