您当前的位置: 首页 > 职位列表 > 职位详情

大模型研发

2-3万元/月
投递简历
浙江-杭州-滨江区
2025-12-09 14:40:09 更新 被浏览:162 次
问径(杭州)数字科技有限公司
最近在线时间:2025-12-09 14:40:09
电话:180********
地址:浙江省杭州市滨江区长河街道聚才路239号1幢1506室
职位描述

职位描述

1、负责大模型算法全周期研发及配套关键技术研究优化,包括多模态模型训练,模型微调(如LoRA、P-Tuning)以及量化和分布式部署等;
2、负责大模型在垂直领域应用的设计划与落地,包括制定创新性的产品研发战略和组合方案,实现模型研发和能力优化,完成年度新产品研发重点任务和阶段研发目标,支撑公司在大模型领域的演进和提升。
3、管理NLP团队,致力于各类人才的培养和技术方向的规划,组织内部技术交流培训,提升团队建模研究和模型工程落地的技术能力。
4、面向大模型重要行业会议、技术研究成果汇报等场合,完成交流演讲汇报。
5、持续关注大模型领域的最新研究与应用趋势,并据此为公司提供具有前瞻性的技术指导和解决方案,引领公司大模型技术进步。

职位要求:
1、国际知名院校硕士及以上学历,博士优先。人工智能、数学、通信工程、电子信息工程等相关专业,有至少半年以上相关工作经验。
2、在大型科技公司(如谷歌、微软、亚马逊、百度、腾讯等)的人工智能部门工作,主持或作为核心技术骨干完成大模型项目的实施、调优和部署,具备完整垂直领域大模型研发和配套产品开发经验优先。
3、具有良好的大模型研发与落地相关技术能力,包括:
1)精通Python、C/C++、Go等编程语言,熟练掌握PyTorch或TensorFlow等主流深度学习框架;
2)精通NLP、AIGC、多模态、CV和语音等AI算法,对开源大模型项目(如BERT、GPT、T5、GLM、LLaMA等)有深入研究和实践经验;
3)精通大模型3D/4D并行技术以及训练、微调技术,如LoRA、p-tuning、SFT、RLHF等;
4)熟悉大模型的分布式系统和多GPU优化,具有跟踪和探索分布式优化新技术的能力,熟悉包括Kubeflow在内的AI平台;
5)熟悉大模型分布式训练技术和框架库,如
Megatron、DeepSpeed、Deepspeed-Chat等,熟悉框架库源码,有千卡以上集群的大模型训练经验6)精通大模型推理优化技术、模型压缩技术,如量化、剪枝和蒸馏等。
4、具有良好的形象气质、逻辑思维能力、沟通交流能力、演示汇报能力,具有较为丰富的演示汇报(包括汇报工作成果、宣读论文、技术交流等)经验,擅长演示汇报材料制作,能够有针对性、清晰且有条理地面向不同层次的听众表达思想观点、展示工作成果。
5、有领导跨学科团队的经验,具备良好的团队组织管理能力,应变能力和工作目标的执行能力,统筹规划设计能力,以及跨团队协作能力。

求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
爬虫工程师
2-4万元/月
浙江-杭州
2025-12-09 14:28:09
投递简历
供应链专员
5000-10000元/月
浙江-杭州
2025-12-03 10:53:33
投递简历
跨境电商运营
4000-7000元/月
浙江-杭州
2025-12-03 10:42:17
投递简历
跨境独立站运营
5000-10000元/月
浙江-杭州
2025-12-03 10:38:17
投递简历
杭州滨江区急招人事专员助理
4000-7000元/月
浙江-杭州
2025-12-03 09:58:44
投递简历
平面设计师
4000-7000元/月
浙江-杭州
2025-12-03 09:41:07
投递简历
Ceo助理岗
4000-7000元/月
浙江-杭州
2025-12-01 17:40:24
投递简历
您可能感兴趣的职位 搜索更多相似职位 >
推荐企业 职位专题
问径(杭州)数字科技有限公司
公司主页 >
微信求职找工作
手机扫一扫
手机扫一扫
随时随地找工作

海量高薪岗位在线免费直招 招聘者/求职者电话直聊

微信小程序
手机也能找工作