您当前的位置：首页 > 职位列表 > 职位详情

通义实验室-模型推理服务技术专家-北/杭

2.5-5万元/月

投递简历

浙江-杭州

1-3年 Java · C++ · Python

2025-12-14 10:02:51 更新被浏览：225 次

阿里云计算有限公司

最近在线时间：2025-12-14 10:02:51

电话：139********

地址：浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室

职位描述

通义实验室工程团队专注于构建面向公众与企业的大规模、高性能在线AI服务平台，支撑通义千问、通义万相及多种开源先进模型的在线服务，推动AIAgents、多模态应用、MCP等前沿技术的产品化落地。
团队持续突破异构GPU资源调度、多模型多地域部署、多模态任务统一推理、多样化服务等级保障（SLO）以及模型推理全链路工程化的关键技术难题，持续提升资源利用效率与系统性能、稳定性。

职位描述
1、设计并实现高性能AI原生网关。打造低延迟、高并发的API网关架构，支持多模态与多协议接入，为国内及海外用户提供灵活、安全、可扩展的流量接入能力，提供全面的数据面管控与可观测性支持；

2、构建智能推理调度与资源管理机制。研发适用于复杂分布式推理场景的请求与资源调度系统，结合动态负载特征与异构硬件环境，持续优化请求分发策略；建设Serverless化资源调度体系，实现资源弹性伸缩与利用率最大化；

3、建设先进的MLOps平台能力。深度优化模型服务的CI/CD流程，推进算法研发到生产部署的自动化与标准化；实现模型版本控制、灰度上线、监控告警、性能分析等全生命周期管理功能，提升迭代速度与系统可靠性。

职位要求
1、计算机/人工智能相关专业硕士及以上学历，精通C++/Python/Java至少一门语言，具备良好的抽象思维能力；

2、深入理解Linux/Posix操作系统核心概念与原理，掌握多线程、异步编程设计方法，熟悉高效开发与调试实践；

3、熟悉微服务架构与分布式系统设计，具备网关系统、调度平台、k8s或云原生相关开发经验者优先；

4、具备优秀的抽象能力、工程决策能力与跨团队协作意识，致力于打造极致性能与高稳定性的系统。

加分项
1、了解开源推理引擎的架构与实现机制，长期关注推理引擎领域主流开源项目；

2、在高性能计算方向有论文发表或相关实践经验