公司名稱:某科技公司
工作地點:上海
工作職責(zé):
1.設(shè)計并開發(fā)實驗評估大模型的擴展性和有效性,研究其在復(fù)雜性問題上的泛化性
2.管理大規(guī)模數(shù)據(jù)并創(chuàng)建可視化方法,設(shè)計基于LLM的新產(chǎn)品。
任職要求:
1、具備高效機器學(xué)習(xí)和深度學(xué)習(xí)的開發(fā)經(jīng)驗,了解AI生成模型框架,包括Transformer decoder、Diffusion等,了解RL和PEFT等。
2、理工科碩士或博士畢業(yè),5年以上產(chǎn)業(yè)界經(jīng)驗,具備扎實的數(shù)理基礎(chǔ)和良好的科研素養(yǎng)。
3、有數(shù)據(jù)流水線的設(shè)計和構(gòu)建經(jīng)驗,有數(shù)據(jù)搜集和培育經(jīng)驗,以及模型性能的評估經(jīng)驗。
4、有復(fù)雜算法的設(shè)計、實現(xiàn)、分析和調(diào)優(yōu)能力。
5、有在GPU集群上的訓(xùn)練和部署經(jīng)驗。
6、有在大型分布式系統(tǒng)上工作的經(jīng)驗。
7、熟悉Web開發(fā),Python和數(shù)據(jù)庫。