1. 垂直領域大語言模型、多模態(tài)大模型微調;
2. 垂直任務Benchmark、評測管線構建和日常評測;
3. 利用大模型及相關工具,搭建workflow/agent來解決實際問題。
4. 數(shù)據(jù)存儲與管理: 設計和管理高效的數(shù)據(jù)庫方案,特別是針對金融時間序列數(shù)據(jù)(如使用DolphinDB, InfluxDB, KDB+等)和非結構化數(shù)據(jù)(如新聞、公告),確保數(shù)據(jù)的完整性、一致性和高可用性。
5. 特征平臺 (Feature Store) 構建: 牽頭構建一個標準化的特征庫(Feature Store),讓策略研究員(做多智能體、vLLM的同事)可以方便地調用、復用和共享特征,避免重復勞動,提升整個團隊的研發(fā)效率。
1. 有大模型或者RL深度學習算法相關實習經驗;
2. 有LLM基礎,了解LLM基本原理、訓練方法和應用技術,了解RAG、Agent方向研發(fā)范式,具備提示詞工程、微調經驗;
3. 對SFT、RLHF、DPO等常見的大模型微調算法都有了解,有實際操作經驗者優(yōu)先;
4. 扎實的編程功底,熟悉pytorch等主流深度學習框架,熟練使用python;
5. 對技術以及用技術解決實際問題有興趣,勇于嘗試;
6. 有天池等競賽經驗、論文發(fā)表者優(yōu)先。
在求職過程中如果遇到扣押證件、收取押金、提供擔保、強迫入股集資、解凍資金、詐騙傳銷、求職歧視、黑中介、人身攻擊、惡意騷擾、惡意營銷、虛假宣傳或其他違法違規(guī)行為。請及時保留證據(jù),立即向平臺舉報投訴,必要時可以報警、起訴,維護自己的合法權益。
