【公司介紹-團隊背景】
淘寶文本搜索算法團隊是淘天集團內(nèi)專注于創(chuàng)新和優(yōu)化搜索技術(shù)的核心團隊。我們的任務(wù)是通過持續(xù)研發(fā)高效、精準的搜索算法,以提升用戶的在線購物體驗和滿意度,進而推動電商平臺的商業(yè)成功。
【崗位描述】
1. 設(shè)計和優(yōu)化強化學習模型:負責基于強化學習的電商搜索模型,包括但不限于Query理解、商品召回和相關(guān)性模型、商品理解模型的設(shè)計、訓練與優(yōu)化,提升搜索算法的準確率和效率。
2. 結(jié)合大模型和多模態(tài)技術(shù):將強化學習技術(shù)與大語言模型和多模態(tài)大模型相結(jié)合,提升文本和多模態(tài)數(shù)據(jù)的處理能力,優(yōu)化搜索結(jié)果的相關(guān)性和多樣性。
3. 生成式檢索系統(tǒng)開發(fā):利用生成式模型結(jié)合強化學習,開發(fā)高效的生成式檢索系統(tǒng),提高搜索體驗。
4. 自動化標注與效率提升:面向Multi-Agents設(shè)計和優(yōu)化自動化標注模型,減少人工標注成本,提升數(shù)據(jù)處理效率。
5. 技術(shù)研究與創(chuàng)新:跟蹤強化學習領(lǐng)域的最新研究,探索新的算法和技術(shù),推動搜索算法的持續(xù)優(yōu)化。
【任職要求】
1. 教育背景:計算機科學、人工智能、數(shù)據(jù)科學等相關(guān)領(lǐng)域的碩士或博士學歷。
2. 強化學習經(jīng)驗:具備扎實的強化學習基礎(chǔ),熟悉強化學習算法(如Q-Learning、Deep Q-Networks、Policy Gradient Methods等),并有實際項目經(jīng)驗。
3. 大模型與多模態(tài)技術(shù):熟悉大規(guī)模預訓練模型(如BERT、GPT等)及其應用,了解多模態(tài)模型的原理和應用場景。
4. 編程能力:熟練掌握Python等編程語言,熟悉深度學習框架(如PyTorch)。
5. 團隊合作與溝通能力:具備良好的團隊合作精神和溝通能力,能夠獨立思考并解決問題。
6. 相關(guān)經(jīng)驗:有電商搜索、推薦系統(tǒng)或自然語言處理相關(guān)經(jīng)驗者優(yōu)先。
加分項:
1. 生成式模型經(jīng)驗:有大模型經(jīng)驗,能夠結(jié)合強化學習進行優(yōu)化。
2. 多模態(tài)模型經(jīng)驗:熟悉多模態(tài)深度學習模型的開發(fā)和應用,能夠處理文本、圖像等多種數(shù)據(jù)類型。
3. 自動標注系統(tǒng)經(jīng)驗:有自動化標注相關(guān)經(jīng)驗,能夠設(shè)計高效的標注模型和流程。
4. 研究與論文發(fā)表:有強化學習、大模型或多模態(tài)領(lǐng)域高水平論文發(fā)表經(jīng)驗者優(yōu)先。
【薪酬福利】
1.基本薪資+績效獎金+股票期權(quán)
2.福利待遇:健康保險(醫(yī)療保險 牙科保險 視力保險)、帶薪休假(年假、病假、其他法定假日)、員工培訓與發(fā)展(培訓課程與發(fā)展機會)、員工福利計劃(健身房會員、餐飲補貼、交通補貼等)
3.其他福利:住房補貼、子女教育補貼等