崗位職責:
1. 強化學習算法設計與開發:負責設計、優化和實現強化學習算法,包括模型自由策略、值函數逼近、策略優化等。
2. 模型訓練與評估:實施強化學習模型的訓練、調參與評估,分析模型表現,調整策略以達到最優性能。
3. 實際應用研究:將強化學習技術應用到實際業務問題中,開發創新的工程解決方案。
4. 技術研究和創新:跟蹤國內外強化學習領域的最新研究成果,探索并引入先進的算法和技術,以提升現有解決方案的性能和效果。
5. 數據處理與仿真環境:負責構建和維護模擬和仿真環境,進行數據預處理,并生成訓練數據,設計合理的獎勵機制。
6. 跨部門協作:同產品、數據工程、業務等多個部門緊密配合,理解業務需求并提出相應的強化學習解決方案。
7. 文檔撰寫與知識分享:編寫算法文檔和技術報告,進行成果展示和知識分享,幫助團隊成員理解強化學習算法及其應用場景。
8. 模型部署與維護:協助將強化學習模型部署到生產環境中,并監控和維護模型性能,進行必要的更新和優化。
崗位要求:
1. 教育背景:計算機科學、電子工程、數學、控制理論或相關專業碩士及以上學歷,博士優先。
2. 編程能力:熟練掌握Python或其他編程語言(如C++、Java),具備實現強化學習算法的能力;了解常見的機器學習和數據處理庫(如TensorFlow、PyTorch、Pandas、NumPy等)。
3. 強化學習基礎:具備扎實的強化學習理論知識,熟悉Q-learning、深度Q-network (DQN)、策略梯度方法(如REINFORCE、PPO、A3C)等經典算法。
4. 數值優化與仿真建模:具有良好的數值優化基礎和算法實現能力,能夠構建和使用仿真環境進行算法測試。
5. 數據分析能力:具備良好的數據分析與處理能力,能夠從數據中提取有效信息,并使用這些信息優化算法。
6. 科研與創新能力:具備較強的科研能力和創新思維,能夠分析并解決在項目實施過程中出現的復雜問題。
7. 團隊合作與溝通能力:有良好的團隊合作精神和溝通能力,能夠與跨職能團隊有效協作,共同推進項目進展。
8. 學習與適應能力:對強化學習和新技術充滿興趣,能夠快速學習和適應新知識、新環境。
9. 附加加分項:有在強化學習領域的實際項目經驗,發表過相關領域論文或在開源項目中有貢獻者優先考慮。
杭州 - 富陽
浙江騰視智駕科技有限公司杭州 - 濱江
廈門星縱物聯科技有限公司杭州 - 濱江
杭州??低晹底旨夹g股份有限公司杭州 - 濱江
浙江宇視科技有限公司杭州 - 西湖
中國船舶集團有限公司第七一五研究所杭州 - 蕭山
佛山市順德區瓊逸澤選企業管理咨詢有限公司