刷新时间:10-30
Agent RL 算法研究员(LLM) 6-8K 参考工资
山东省青岛市市南区  |  应届毕业生 |  硕士  |  年龄不限  |  招2人  |  校招
五险一金年终奖全勤奖节日福利双休健康体检通讯补贴提供住宿餐补/工作餐
...
收藏 投诉
很抱歉,该职位的招聘截止了!
天涯何处无芳草,何必单恋一枝花!看看这个公司的其他职位吧~
专业要求
应用经济学
数学
物理学
统计学
信息与通信工程
控制科学与工程
计算机科学与技术
网络空间安全
软件工程
薪资详情

发放方式:每月15日     

岗位职责

1. RL-enhanced LLM Agent:结合强化学习环境,构建具备记忆、反思、规划、自进化及工具调用能力的类人智能体。
2. Multi-Agent systems:研究多个智能体如何高效协作,以完成超越单个智能体能力范围的任务。
3. Omni-LLM-based Agent:开发融合文本、语音、图像多模态的智能体。
4. World Model:探索AI系统如何构建自身与外部世界的认知与期望模型。
5. 数据迭代流程优化:深入理解数据需求,推动人机协同的数据迭代流程,实现从人工到半自动化再到自动化的转变。

岗位要求

1. 教育背景:高校研究生在读,具备良好的计算机或数学基础,拥有较强的编码能力。
2. 技术背景:具有LLM(大语言模型)、强化学习、推理模型等相关背景,熟悉主流大语言模型的算法架构。
3. 对齐方法:了解Alignment领域的常用方法,包括但不限于SFT、DPO、PPO、Self-Rewarding和Self-Critic等。
4. 能力要求:具备卓越的实验分析与问题解决能力,拥有创新思维,能够进行良好的沟通,并与团队成员高效协作。
【加分项】
1. 深度学习基础:具备深度学习、机器学习的基础知识,熟悉有监督学习、自监督学习等基本训练范式。
2. 项目经验:在大语言模型方面有开源项目经验者优先,或曾通过机器学习算法解决过复杂问题。特别欢迎跨界研究者。
3. 竞赛奖项:在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先。
4. 学术成果: ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先。

工作地址
山东省青岛市市南区·香港中路26号远雄国际广场909室
HR信息
韩女士
今日活跃
与HR聊聊
安全警示
立即投诉

在求职过程中如果遇到扣押证件、收取押金、提供担保、强迫入股集资、解冻资金、诈骗传销、求职歧视、黑中介、人身攻击、恶意骚扰、恶意营销、虚假宣传或其他违法违规行为。请及时保留证据,立即向平台举报投诉,必要时可以报警、起诉,维护自己的合法权益。

公司其他职位 查看本公司更多职位
算法工程师
12-20K 青岛市-市南区 | 年龄不限 | 硕士
大模型金融数据研究员
12-20K 青岛市-市南区 | 年龄不限 | 硕士
RL金融量化算法工程师
12-20K 青岛市-市南区 | 年龄不限 | 硕士
RL量化算法研究员(侧重RL)
6-8K 青岛市-市南区 | 年龄不限 | 硕士
RL金融量化算法工程师
12-20K 青岛市-市南区 | 年龄不限 | 硕士
大模型金融数据研究员
12-20K 青岛市-市南区 | 年龄不限 | 硕士
贸易/进出口 矿产/采掘/冶炼 零售/批发
私营企业
50~100人
青岛市市南区香港中路26号远雄国际广场909室
感兴趣的职位
青岛市市南区 | 应届毕业生 | 本科
山东盛安国际贸易有限公司
电商采购兼职 30元/小时
青岛市市南区 | 学历不限
延津县瑞歌商贸行(个体工商户)
青岛市 | 应届毕业生 | 大专
青岛振华机动车销售维修有限公司
青岛市市南区 | 应届毕业生 | 大专
华基国际物流(宁波)有限公司青岛分公司
风险提示
企业基本资料已通过 平台认证
以上资料仅供参考,请求职者 规避求职风险