强化学习算法工程师-武汉
1.6-2.5万元/月
投递简历
湖北-武汉-江夏区
3-5年
PyTorch · 大数据处理框架(Spark/Hadoop/Hive) · 强化学习 · RL · LLM · 模型加速/性能优化 · TensorFlow
2025-10-29 13:11:21 更新
被浏览:819 次
深圳市中电电力技术股份有限公司
最近在线时间:2025-10-29 13:11:21
电话:182********
地址:深圳市福田区车公庙泰然工贸园201栋8楼西
职位描述
职位描述:
1、负责强化学习(RL)核心算法的设计与工程实现,打造高效智能决策模型,支撑软件体系从需求分析到部署运维全流程的智能化升级;
2、推进深度强化学习(DRL)关键技术研究,重点攻关大语言模型(LLM)与多智能体强化学习(MARL)的协同创新,加速其在能源微电网、工业自动化等复杂场景的大规模落地应用。
职位要求:
硬性条件:
1、具备3年以上强化学习实际项目经验,熟练掌握DQN、PPO、SAC等主流算法,具有大规模强化学习系统上线部署经历;
2、熟练运用PyTorch/TensorFlow框架进行模型开发与优化;
3、在ICML/NeurIPS/AAAI等顶级会议发表过相关论文者优先考虑。
加分项:
1、拥有大语言模型(LLM)调优或RLHF(基于人类反馈的强化学习)实践经验;
2、了解多智能体博弈机制与联邦学习技术,有电力调度、机器人控制等相关领域项目背景;
3、数学功底扎实,熟悉随机过程、博弈论及最优控制理论。
软性素质:
1、具备技术洞察力,能快速理解并复现前沿研究成果,推动算法迭代与创新;
2、结果驱动型思维,善于从实际业务问题出发反向设计技术解决方案。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
您可能感兴趣的职位
搜索更多相似职位 >
-
催乳师
8000-10000/元投递简历
-
【新塘】30招做长期组装工
10388-10500/元投递简历
-
学校宿管(进港大道包住)
3800-4000/元投递简历
-
广州滴滴司机-薪酬日结
9000-13500/元投递简历
-
急招催乳/产康师/包吃住/新手可招
8000-15000/元投递简历
-
【石碁】联昊通快递司机
面议投递简历
-
【石碁】会计文员(话补)
4500-5000/元投递简历
-
清洁工阿姨
面议投递简历
-
区域销售精英:月可入2万
10000-20000/元投递简历
推荐企业
职位专题
微信求职找工作
手机扫一扫
随时随地找工作