崗位職責(zé):
1.大模型性能優(yōu)化:負(fù)責(zé)大型深度學(xué)習(xí)模型(如Transformer、BERT、GPT等)的性能調(diào)優(yōu)工作,包括但不限于模型收斂速度、準(zhǔn)確率、泛化能力等關(guān)鍵指標(biāo)的優(yōu)化。
2.算法研究與實(shí)現(xiàn):跟蹤并研究最新的深度學(xué)習(xí)算法、優(yōu)化技巧及前沿技術(shù),將研究成果轉(zhuǎn)化為實(shí)際應(yīng)用,提升模型效果。
3.數(shù)據(jù)預(yù)處理與分析:參與數(shù)據(jù)集的預(yù)處理與分析工作,設(shè)計(jì)并實(shí)施數(shù)據(jù)清洗、特征工程等策略,確保數(shù)據(jù)質(zhì)量滿足模型訓(xùn)練需求。
4.模型訓(xùn)練與評(píng)估:利用TensorFlow、PyTorch等深度學(xué)習(xí)框架進(jìn)行模型訓(xùn)練,設(shè)計(jì)合理的評(píng)估指標(biāo)體系,對(duì)模型效果進(jìn)行全面評(píng)估。
5.團(tuán)隊(duì)協(xié)作與溝通:與產(chǎn)品經(jīng)理、數(shù)據(jù)工程師、其他算法工程師緊密合作,共同推動(dòng)項(xiàng)目進(jìn)展,確保項(xiàng)目按時(shí)按質(zhì)完成。
6.文檔撰寫(xiě)與分享:撰寫(xiě)技術(shù)文檔,分享研究成果與經(jīng)驗(yàn),提升團(tuán)隊(duì)整體技術(shù)水平。
任職要求:
1.教育背景:計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、物理等相關(guān)專業(yè)本科及以上學(xué)歷,碩士及以上學(xué)歷優(yōu)先。
2.工作經(jīng)驗(yàn):
o至少3年以上算法工程師相關(guān)工作經(jīng)驗(yàn),有大模型調(diào)優(yōu)項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
o具備良好的問(wèn)題解決能力和創(chuàng)新能力,能夠獨(dú)立承擔(dān)項(xiàng)目任務(wù)。
3.專業(yè)技能:
o精通Python編程語(yǔ)言,熟悉TensorFlow、PyTorch等深度學(xué)習(xí)框架。
o對(duì)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法有深入理解,具備扎實(shí)的數(shù)學(xué)基礎(chǔ)(線性代數(shù)、概率統(tǒng)計(jì)、微積分等)。
o熟悉常見(jiàn)的模型優(yōu)化算法(如梯度下降、Adam等),了解模型并行計(jì)算、分布式訓(xùn)練等技術(shù)。
o有NLP、CV等大模型調(diào)優(yōu)經(jīng)驗(yàn)者優(yōu)先。