您当前的位置：首页 > 职位列表 > 职位详情

多模态视觉理解与生成算法专家（杭-T85）

6-9万元/月

投递简历

浙江-杭州

5-10年多模态 · 计算机视觉 · 强化学习 · agent

2025-12-14 11:03:52 更新被浏览：610 次

维沃移动通信有限公司

最近在线时间：2025-12-14 11:03:52

电话：187********

地址：东莞市长安镇乌沙步步高大道288号

职位描述

工作职责：
1、负责面向人像摄影场景的智能拍摄系统（Agent）算法架构设计与性能调优；
2、主导多模态视觉感知与理解领域大模型（如VLM、CLIP等）的算法研发、工程实现与效果提升；
3、推进大型语言模型（LLM）在摄影应用中的推理逻辑与建议能力优化；
4、融合强化学习反馈机制（RLAIF），增强智能体在实际场景中的决策与推荐表现；
5、开展AIGC图像生成与编辑类算法在具体业务环境下的落地优化与效率改进。

职位要求：
1、熟练掌握深度学习及图像处理相关算法，具备扎实编程基础，能够高效使用Python进行开发；
2、具有多模态理解与生成方向的丰富研发经验，熟悉CLIP、VLM、LLM、RLHF、RLAIF、智能体（Agent）、SD、AIGC等关键技术，具备优秀的算法实现与调优能力；
3、具备良好的沟通协作能力，能准确把握业务需求并推动项目协同落地；对技术探索有热情，具备自主学习能力和持续成长意愿；
4、在顶级学术会议发表过论文或拥有博士学位者优先录用。

求职提醒：求职过程请勿缴纳费用，谨防诈骗！若信息不实请举报。

该公司的其他职位

编译器研发专家

6-8万元/月

浙江-杭州

2025-12-14 13:10:51

投递简历

Android构建系统研发工程师

3-6万元/月

浙江-杭州

2025-12-14 12:15:40

投递简历