青岛Agent RL 算法研究员（LLM）招聘信息|青岛威瑞富泰能源有限公司招聘信息-齐鲁人才网

刷新时间：10-30

Agent RL 算法研究员（LLM） 6-8K 参考工资

山东省青岛市市南区 | 应届毕业生 | 硕士 | 年龄不限 | 招2人 | 校招

五险一金年终奖全勤奖节日福利双休健康体检通讯补贴提供住宿餐补/工作餐

...

专业要求

应用经济学

数学

物理学

统计学

信息与通信工程

控制科学与工程

计算机科学与技术

网络空间安全

软件工程

薪资详情

发放方式：每月15日

岗位职责

1. RL-enhanced LLM Agent：结合强化学习环境，构建具备记忆、反思、规划、自进化及工具调用能力的类人智能体。
2. Multi-Agent systems：研究多个智能体如何高效协作，以完成超越单个智能体能力范围的任务。
3. Omni-LLM-based Agent：开发融合文本、语音、图像多模态的智能体。
4. World Model：探索AI系统如何构建自身与外部世界的认知与期望模型。
5. 数据迭代流程优化：深入理解数据需求，推动人机协同的数据迭代流程，实现从人工到半自动化再到自动化的转变。

岗位要求

1. 教育背景：高校研究生在读，具备良好的计算机或数学基础，拥有较强的编码能力。
2. 技术背景：具有LLM（大语言模型）、强化学习、推理模型等相关背景，熟悉主流大语言模型的算法架构。
3. 对齐方法：了解Alignment领域的常用方法，包括但不限于SFT、DPO、PPO、Self-Rewarding和Self-Critic等。
4. 能力要求：具备卓越的实验分析与问题解决能力，拥有创新思维，能够进行良好的沟通，并与团队成员高效协作。
【加分项】
1. 深度学习基础：具备深度学习、机器学习的基础知识，熟悉有监督学习、自监督学习等基本训练范式。
2. 项目经验：在大语言模型方面有开源项目经验者优先，或曾通过机器学习算法解决过复杂问题。特别欢迎跨界研究者。
3. 竞赛奖项：在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先。
4. 学术成果： ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先。

工作地址

山东省青岛市市南区·香港中路26号远雄国际广场909室

HR信息