您当前的位置: 首页 > 职位列表 > 职位详情

通义实验室-模型推理服务技术专家-北/杭

2.5-5万元/月
投递简历
浙江-杭州
1-3年 Java · C++ · Python
2025-12-14 10:02:51 更新 被浏览:225 次
阿里云计算有限公司
最近在线时间:2025-12-14 10:02:51
电话:139********
地址:浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
职位描述

通义实验室工程团队专注于构建面向公众与企业的大规模、高性能在线AI服务平台,支撑通义千问、通义万相及多种开源先进模型的在线服务,推动AIAgents、多模态应用、MCP等前沿技术的产品化落地。
团队持续突破异构GPU资源调度、多模型多地域部署、多模态任务统一推理、多样化服务等级保障(SLO)以及模型推理全链路工程化的关键技术难题,持续提升资源利用效率与系统性能、稳定性。

职位描述
1、设计并实现高性能AI原生网关。打造低延迟、高并发的API网关架构,支持多模态与多协议接入,为国内及海外用户提供灵活、安全、可扩展的流量接入能力,提供全面的数据面管控与可观测性支持;

2、构建智能推理调度与资源管理机制。研发适用于复杂分布式推理场景的请求与资源调度系统,结合动态负载特征与异构硬件环境,持续优化请求分发策略;建设Serverless化资源调度体系,实现资源弹性伸缩与利用率最大化;

3、建设先进的MLOps平台能力。深度优化模型服务的CI/CD流程,推进算法研发到生产部署的自动化与标准化;实现模型版本控制、灰度上线、监控告警、性能分析等全生命周期管理功能,提升迭代速度与系统可靠性。

职位要求
1、计算机/人工智能相关专业硕士及以上学历,精通C++/Python/Java至少一门语言,具备良好的抽象思维能力;

2、深入理解Linux/Posix操作系统核心概念与原理,掌握多线程、异步编程设计方法,熟悉高效开发与调试实践;

3、熟悉微服务架构与分布式系统设计,具备网关系统、调度平台、k8s或云原生相关开发经验者优先;

4、具备优秀的抽象能力、工程决策能力与跨团队协作意识,致力于打造极致性能与高稳定性的系统。

加分项
1、了解开源推理引擎的架构与实现机制,长期关注推理引擎领域主流开源项目;

2、在高性能计算方向有论文发表或相关实践经验

求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
阿里云-专有云稳定性架构师-北京/杭州
3-5万元/月
北京-朝阳区
2025-12-14 15:00:47
投递简历
解决方案架构师(汽车)(AI智能出行方向)
3-6万元/月
北京-朝阳区
2025-12-14 14:54:52
投递简历
容器与Kubernetes资深研发工程师
3.5-6.5万元/月
广东-深圳
2025-12-14 14:18:02
投递简历
AI智算集群运维管控与计算资源调度平台研发专家
3-6万元/月
北京-朝阳区
2025-12-14 14:16:51
投递简历
资深安全工程师
3-5万元/月
北京-朝阳区
2025-12-14 14:16:30
投递简历
阿里云文件存储技术专家
4-7万元/月
上海-徐汇区
2025-12-14 13:56:17
投递简历
阿里云智能-IDC数据中心运维专家-张北
2.5-4万元/月
河北-张家口
2025-12-14 13:12:29
投递简历
阿里云智能-后端开发-AI编程
3.5-5万元/月
浙江-杭州
2025-12-14 13:07:51
投递简历
阿里云智能-云平台运维专家-杭州
2-4万元/月
浙江-杭州
2025-12-14 13:07:47
投递简历
阿里云智能-弹性计算技术架构师-杭州
4-7万元/月
浙江-杭州
2025-12-14 13:04:57
投递简历
您可能感兴趣的职位 搜索更多相似职位 >
推荐企业 职位专题
阿里云计算有限公司
公司主页 >
微信求职找工作
手机扫一扫
手机扫一扫
随时随地找工作

海量高薪岗位在线免费直招 招聘者/求职者电话直聊

微信小程序
手机也能找工作