崗位職責:
1、負責大模型(如GPT、BERT、LLaMA等)的應用開發、微調和優化;
2、根據業務需求,設計和實現基于大模型的解決方案,如文本生成、對話系統、知識問答等;
3、針對特定領域或場景,進行大模型的微調(Fine-tuning)和提示工程(Prompt Engineering);
4、開發基于大模型的知識庫構建、檢索增強生成(RAG)系統及相關應用;
5、研究并探索大模型在不同業務場景中的創新性應用;
6、優化大模型的推理性能,降低資源消耗,提升響應速度;
7、跟蹤大模型領域的最新研究進展,并將新技術應用到實際項目中;
8、與產品、數據團隊協作,完成模型部署和效果評估。
任職要求:
1、學歷要求:計算機科學、人工智能、數學、統計學等相關專業碩士及以上學歷。
2、工作經驗:3年以上機器學習/深度學習相關經驗,1年以上大模型應用或微調經驗。
3、技術要求:
(1)熟悉深度學習框架(如PyTorch、TensorFlow),具備扎實的編程能力(Python為主);
(2)熟悉常見的大模型架構(如Transformer、GPT、BERT等),了解其原理和實現細節;
(3)具備大模型微調經驗,熟悉LoRA、P-Tuning、Adapter等微調技術;
(4)熟悉提示工程(Prompt Engineering)和少樣本學習(Few-shot Learning);
(5)熟悉大模型的推理優化技術,如量化、剪枝、蒸餾等技術,能夠優化模型性能并降低資源消耗。
(6)熟悉常見的NLP任務,如文本分類、命名實體識別、文本生成、對話系統等;
(7)了解分布式訓練和推理框架(如DeepSpeed、Megatron-LM);
(8)最好有基于大模型的實際業務應用開發經驗,能夠將模型能力轉化為可落地的產品或服務;
(9)熟練使用Java或Python開發服務端應用,熟悉FastAPI或其他類似框架。
4、個人素質:
具備良好的溝通能力和團隊協作精神;
有較強的學習能力和解決問題的能力;
對技術有熱情,能夠主動關注新技術并應用到工作中。
5、加分項:
有大模型部署經驗,熟悉ONNX、TensorRT等推理加速工具;
有實際的大規模數據處理和清洗經驗;
在大模型領域有相關論文發表、專利申請或技術創新經驗或在頂級會議(如NeurIPS、ICML、ACL等)發表過相關論文;
熟悉多模態大模型(如圖文生成、視頻理解等)。