您当前的位置：首页 > 职位列表 > 职位详情

大模型算法

4-8万元/月

投递简历

上海-浦东新区

call · 训练 · l l m · agent · d po

2026-01-09 12:52:46 更新被浏览：125 次

武汉新仕佳人力资源有限公司

最近在线时间：2026-01-09 12:52:46

电话：139********

地址：武汉东湖新技术开发区关南科技工业园现代·国际设计城三期9幢6层4号

职位描述

工作职责
1、参与设计并实现代码生成（可视化方向）、Functioncall、RAG等方向的大模型后训练算法。
2、结合业务数据和场景，设计Posttraining的高质量数据构建方案（含数据洞察、数据合成、数据质量优化等）提升模型的应用效果。
3、与工程以及产运团队协作，参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地；
4、密切关注业界LLM微调算法和数据提质领域的前沿论文，并整合新技术和算法到训练引擎中，提升框架的领先性。

任职要求
1、在后训练微调领域拥有丰富的项目经验，熟恶DPO、PPO、GRPO、KTO、ReFT等算法原理，具备扎实的数学基础，熟悉线性代数、概率统计、优化算法等。
2、对Megatron-LM、DeepSpeed等分布式框架及LLaMA-Factory、ms-swift等大模型微调工具库有一定的了解或相关开发经验。
3、具备优秀的算法研发能力，对LLM领域前沿技术有热情，能够自驱地设计丰富的实验并完成论文技术的落地验证。
4、拥有良好的沟通表达能力和团队协作精神，具有强烈的责任心和使命感。

求职提醒：求职过程请勿缴纳费用，谨防诈骗！若信息不实请举报。

该公司的其他职位

深圳福田区急招Java

3-6万元/月

广东-深圳

2026-01-10 21:51:23

投递简历

DSP（新能源）

2.5-5万元/月

广东-广州

2026-01-10 21:47:03

投递简历