发放方式:每月15日
1. RL-enhanced LLM Agent:结合强化学习环境,构建具备记忆、反思、规划、自进化及工具调用能力的类人智能体。
2. Multi-Agent systems:研究多个智能体如何高效协作,以完成超越单个智能体能力范围的任务。
3. Omni-LLM-based Agent:开发融合文本、语音、图像多模态的智能体。
4. World Model:探索AI系统如何构建自身与外部世界的认知与期望模型。
5. 数据迭代流程优化:深入理解数据需求,推动人机协同的数据迭代流程,实现从人工到半自动化再到自动化的转变。
1. 教育背景:高校研究生在读,具备良好的计算机或数学基础,拥有较强的编码能力。
2. 技术背景:具有LLM(大语言模型)、强化学习、推理模型等相关背景,熟悉主流大语言模型的算法架构。
3. 对齐方法:了解Alignment领域的常用方法,包括但不限于SFT、DPO、PPO、Self-Rewarding和Self-Critic等。
4. 能力要求:具备卓越的实验分析与问题解决能力,拥有创新思维,能够进行良好的沟通,并与团队成员高效协作。
【加分项】
1. 深度学习基础:具备深度学习、机器学习的基础知识,熟悉有监督学习、自监督学习等基本训练范式。
2. 项目经验:在大语言模型方面有开源项目经验者优先,或曾通过机器学习算法解决过复杂问题。特别欢迎跨界研究者。
3. 竞赛奖项:在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先。
4. 学术成果: ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先。
在求职过程中如果遇到扣押证件、收取押金、提供担保、强迫入股集资、解冻资金、诈骗传销、求职歧视、黑中介、人身攻击、恶意骚扰、恶意营销、虚假宣传或其他违法违规行为。请及时保留证据,立即向平台举报投诉,必要时可以报警、起诉,维护自己的合法权益。
