通义实验室-模型推理服务技术专家-北/杭
2.5-5万元/月通义实验室工程团队专注于构建面向公众与企业的大规模、高性能在线AI服务平台,支撑通义千问、通义万相及多种开源先进模型的在线服务,推动AIAgents、多模态应用、MCP等前沿技术的产品化落地。
团队持续突破异构GPU资源调度、多模型多地域部署、多模态任务统一推理、多样化服务等级保障(SLO)以及模型推理全链路工程化的关键技术难题,持续提升资源利用效率与系统性能、稳定性。
职位描述
1、设计并实现高性能AI原生网关。打造低延迟、高并发的API网关架构,支持多模态与多协议接入,为国内及海外用户提供灵活、安全、可扩展的流量接入能力,提供全面的数据面管控与可观测性支持;
2、构建智能推理调度与资源管理机制。研发适用于复杂分布式推理场景的请求与资源调度系统,结合动态负载特征与异构硬件环境,持续优化请求分发策略;建设Serverless化资源调度体系,实现资源弹性伸缩与利用率最大化;
3、建设先进的MLOps平台能力。深度优化模型服务的CI/CD流程,推进算法研发到生产部署的自动化与标准化;实现模型版本控制、灰度上线、监控告警、性能分析等全生命周期管理功能,提升迭代速度与系统可靠性。
职位要求
1、计算机/人工智能相关专业硕士及以上学历,精通C++/Python/Java至少一门语言,具备良好的抽象思维能力;
2、深入理解Linux/Posix操作系统核心概念与原理,掌握多线程、异步编程设计方法,熟悉高效开发与调试实践;
3、熟悉微服务架构与分布式系统设计,具备网关系统、调度平台、k8s或云原生相关开发经验者优先;
4、具备优秀的抽象能力、工程决策能力与跨团队协作意识,致力于打造极致性能与高稳定性的系统。
加分项
1、了解开源推理引擎的架构与实现机制,长期关注推理引擎领域主流开源项目;
2、在高性能计算方向有论文发表或相关实践经验