工作職責(zé):
對海量音頻信息進行分析和信息提取。
崗位職責(zé)主要包括:
1. 方言語音識別,對視頻等場景中的方言進行語音識別
2. 音頻分類,音頻事件檢測,對音視頻文件中的有效內(nèi)容進行標(biāo)簽提取,特別是語音文字之外的信息提?。?/span>
3. 語種識別,說話人識別,提升已有系統(tǒng)在復(fù)雜場景(噪聲,遠場,混響)中的魯棒性;
4. 說話人Anti-Spoofing,提升虛假音頻攻防對抗的識別能力。
任職要求:
1. 碩士或及以上學(xué)歷,計算機,信號處理、模式識別,自動化相關(guān)專業(yè);
2. 了解聲紋識別,語種識別,音頻事件檢測或語音識別領(lǐng)域的技術(shù)發(fā)展情況,掌握主流算法,有過開發(fā)實際系統(tǒng)或其中某一模塊(前端、特征、建模、匹配)的經(jīng)歷;
3. 扎實的機器學(xué)習(xí)和模式分類功底;
4. 熟練掌握 C/C++或Python, 編程能力強;熟悉 Linux 環(huán)境開發(fā);
5. 對Kaldi、Pytorch、TensorFlow(至少其一)熟練使用;
6. 參加NIST等評測比賽取的較好名次者優(yōu)先;
7. 良好的溝通能力與團隊協(xié)作精神;
8. 在ICASSP, INTERSPEECH, ASRU, CSL, Speech Communication等知名會議和期刊發(fā)表過論文者優(yōu)先