發(fā)放方式:每月15日?????
1. RL-enhanced LLM Agent:結(jié)合強化學習環(huán)境,構(gòu)建具備記憶、反思、規(guī)劃、自進化及工具調(diào)用能力的類人智能體。
2. Multi-Agent systems:研究多個智能體如何高效協(xié)作,以完成超越單個智能體能力范圍的任務。
3. Omni-LLM-based Agent:開發(fā)融合文本、語音、圖像多模態(tài)的智能體。
4. World Model:探索AI系統(tǒng)如何構(gòu)建自身與外部世界的認知與期望模型。
5. 數(shù)據(jù)迭代流程優(yōu)化:深入理解數(shù)據(jù)需求,推動人機協(xié)同的數(shù)據(jù)迭代流程,實現(xiàn)從人工到半自動化再到自動化的轉(zhuǎn)變。
1. 教育背景:高校研究生在讀,具備良好的計算機或數(shù)學基礎(chǔ),擁有較強的編碼能力。
2. 技術(shù)背景:具有LLM(大語言模型)、強化學習、推理模型等相關(guān)背景,熟悉主流大語言模型的算法架構(gòu)。
3. 對齊方法:了解Alignment領(lǐng)域的常用方法,包括但不限于SFT、DPO、PPO、Self-Rewarding和Self-Critic等。
4. 能力要求:具備卓越的實驗分析與問題解決能力,擁有創(chuàng)新思維,能夠進行良好的溝通,并與團隊成員高效協(xié)作。
【加分項】
1. 深度學習基礎(chǔ):具備深度學習、機器學習的基礎(chǔ)知識,熟悉有監(jiān)督學習、自監(jiān)督學習等基本訓練范式。
2. 項目經(jīng)驗:在大語言模型方面有開源項目經(jīng)驗者優(yōu)先,或曾通過機器學習算法解決過復雜問題。特別歡迎跨界研究者。
3. 競賽獎項:在 ACM/ICPC、NOI/IOI、Kaggle 等編程/AI 比賽獲獎者優(yōu)先。
4. 學術(shù)成果: ICML、ICLR、NeurIPS、ACL、CVPR 等頂級學術(shù)會議發(fā)表過有影響力研究成果的優(yōu)先。
在求職過程中如果遇到扣押證件、收取押金、提供擔保、強迫入股集資、解凍資金、詐騙傳銷、求職歧視、黑中介、人身攻擊、惡意騷擾、惡意營銷、虛假宣傳或其他違法違規(guī)行為。請及時保留證據(jù),立即向平臺舉報投訴,必要時可以報警、起訴,維護自己的合法權(quán)益。
