多模态视觉理解与生成算法专家(杭-T85)
6-9万元/月
投递简历
浙江-杭州
5-10年
多模态 · 计算机视觉 · 强化学习 · agent
2025-12-14 11:03:52 更新
被浏览:610 次
维沃移动通信有限公司
最近在线时间:2025-12-14 11:03:52
电话:187********
地址:东莞市长安镇乌沙步步高大道288号
职位描述
工作职责:
1、负责面向人像摄影场景的智能拍摄系统(Agent)算法架构设计与性能调优;
2、主导多模态视觉感知与理解领域大模型(如VLM、CLIP等)的算法研发、工程实现与效果提升;
3、推进大型语言模型(LLM)在摄影应用中的推理逻辑与建议能力优化;
4、融合强化学习反馈机制(RLAIF),增强智能体在实际场景中的决策与推荐表现;
5、开展AIGC图像生成与编辑类算法在具体业务环境下的落地优化与效率改进。
职位要求:
1、熟练掌握深度学习及图像处理相关算法,具备扎实编程基础,能够高效使用Python进行开发;
2、具有多模态理解与生成方向的丰富研发经验,熟悉CLIP、VLM、LLM、RLHF、RLAIF、智能体(Agent)、SD、AIGC等关键技术,具备优秀的算法实现与调优能力;
3、具备良好的沟通协作能力,能准确把握业务需求并推动项目协同落地;对技术探索有热情,具备自主学习能力和持续成长意愿;
4、在顶级学术会议发表过论文或拥有博士学位者优先录用。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
您可能感兴趣的职位
搜索更多相似职位 >
推荐企业
职位专题
微信求职找工作
手机扫一扫
随时随地找工作