崗位職責:
1. 數據收集與管理
o 收集和整理用于微調 LLM 的高質量數據,包括特定領域文本資料、用戶對話記錄、常見問題解答等。
o 對數據進行清洗、標注和分類,確保數據準確性、一致性和完整性,符合模型微調要求。
2. 數據安全與合規
o 負責保障數據在開發和使用過程中的安全和合規性,遵守數據隱私法規。
o 采取加密、訪問控制等措施保護用戶數據,確保使用 LLM 過程中數據處理符合法律和道德標準。
3. 數據注入與更新
o 將整理好的數據有效注入到 LLM 中,確保模型能學習新的知識和模式。
o 根據產品發展和新業務需求,及時更新數據,保持模型對最新信息的敏感度。
崗位要求:
1. 教育背景:本科及以上學歷,計算機科學、數據工程、統計學等相關專業。
2. 工作經驗:具有 2 年以上數據工程相關工作經驗,有處理自然語言數據經驗者優先。
3. 技術能力:熟練掌握數據處理工具和技術,如 SQL、Python 數據處理庫(如 Pandas)。熟悉數據存儲系統,如關系型數據庫(MySQL、PostgreSQL)和非關系型數據庫(MongoDB、Cassandra)。掌握數據清洗、標注、分類的方法和工具。
4. 安全意識:具備較強的數據安全意識,熟悉數據隱私法規,能夠確保數據在整個生命周期內的安全和合規。
長沙 - 望城
長沙巨云教育咨詢有限公司長沙 - 雨花
安徽愛斯威爾新能源科技有限公司長沙 - 岳麓
深圳市美正科技有限公司長沙分公司長沙 - 天心
湖南瑞生醫療科技有限公司長沙 - 長沙
河南易眾拍賣行有限公司長沙 - 岳麓
三諾生物