崗位職責:
1.負責大語言模型(LLM)相關應用的后端服務的設計、開發和優化;
2.搭建高可用、低延遲的服務框架,支持大規模并發請求下的模型響應能力;
3.負責LLM應用的部署、維護和故障排查,確保服務穩定性和可靠性;
4.構建自動化運維體系(如CI/CD流程),設計并實施系統監控告警機制(指標包括但不限于CPU/內存占用、請求延遲、QPS等)。
任職要求:
1.計算機科學、人工智能、數據科學、數學等相關專業,本科及以上學歷
2.技能要求:
? 3年左右后端工作經驗,精通后端開發框架,精通至少一門后端編程語言(Python),熟悉Linux環境及Shell腳本;
? 掌握微服務架構設計,有Docker/Kubernetes等容器化部署經驗者優先;
? 具備大規模分布式系統開發或高性能計算場景優化經驗優先;
? 有大語言模型(如BERT、GPT系列等)的后端服務化部署案例者優先;
? 對LLM的應用場景(如對話系統、文本生成)有實際落地經驗優先;
3.具備良好的溝通能力和團隊合作精神;
4.較強的學習意愿和解決問題的能力。