崗位職責
1、負責大語言模型預訓練算法和底層原理研究;
2、負責大語言模型在垂直領域的微調、蒸餾等方法研究與實現;
3、負責大語言模型與視覺模型的結合應用研究與實現;
4、負責大語言模型與知識圖譜技術的融合研究與實現;
5、負責大語言模型在具體業務場景中的應用落地。
任職資格
1.計算機科學或人工智能等相關專業,碩士及以上學歷;
2.NLP、大語言模型等研究方向,信息挖掘、知識圖譜等相關領域;
3.編程功底扎實,熟練使用C++或Python等編程語言;
4.熟練使用常用的深度學習框架,如TensorFlow、PyTorch等;
5.熟悉主流大語言模型(GPT/T5/PaLM/LLaMA/GLM等)的原理和訓練方法,對模型設計和適用場景有深入的理解;
6.熟悉大語言模型訓練、微調和優化策略,如高質量數據清洗、模型質量評估、Pretrain、SFT、RLHF等;
7.熟悉利用大語言模型進行知識圖譜的構建和融合;
8.熟悉利用大語言模型進行業務應用構建的相關技術,如:LangChain、向量數據庫等。
9.具有分析問題和解決問題的能力,能夠自我驅動,具有良好的團隊合作精神,較強的溝通能力。
加分項:
1.具備大模型預訓練,文本生成,多輪對話、知識圖譜、常識推理、推薦搜索、多模態理解、信息檢索等方面實踐經驗者優先。
2.有大規模分布式訓練部署等經驗優先。