摘要:4月9日,Skype Translator實時語音翻譯中文預(yù)覽版發(fā)布,實現(xiàn)了英文與中文普通話之間的實時語音對話。微軟研究院戰(zhàn)略總監(jiān)及技術(shù)顧問Vikram Dendi、微軟亞洲研究院副院長張益肇詳細(xì)解讀了整個翻譯過程及核心技術(shù)。
繼2014年12月Skype Translator推出英文和西班牙文之間的實時語音翻譯之后,2015年4月9日,又在中國市場隆重推出另一重要版本:Skype Translator實時語音翻譯中文預(yù)覽版,實現(xiàn)了英文與中文普通話之間的實時語音對話。Windows 8.1用戶可在Skype Translator注冊頁面完成中文版的注冊后開始試用。
為世界各地人們提供跨語言的無障礙溝通,是Skype Translator一直以來所遵循的基本理念。因中文本身復(fù)雜的語法結(jié)構(gòu),對母語為英語的學(xué)習(xí)者來說一直較難掌握。Skype Translator中文預(yù)覽版的發(fā)布,在一定程度上打破了中英文之間的溝通障礙,也昭示著微軟在語音翻譯領(lǐng)域的又一突破。整套實時語音翻譯技術(shù)完全依托于微軟在自然語言處理、機器翻譯、語音識別及語音合成、深層神經(jīng)網(wǎng)絡(luò)(DNNs)等多領(lǐng)域的研發(fā)成果。
Skype Translator中文預(yù)覽版翻譯過程主要包括語音識別、文本校正、機器翻譯、語音合成四大部分。微軟研究院戰(zhàn)略總監(jiān)及技術(shù)顧問Vikram Dendi、微軟亞洲研究院副院長張益肇在媒體溝通會上,詳細(xì)解讀了整個翻譯過程及核心技術(shù)。
語音翻譯過程中,語音識別是步。每個人都有自己的交流習(xí)慣,對話過程中飽含感情與思想,這是區(qū)別于人與機器交流的大不同點。為了讓Skype Translator營造出更貼進真實的對話場景,微軟亞洲研究院與位于雷蒙德的微軟研究院總部團隊展開合作,將深層神經(jīng)網(wǎng)絡(luò)(DNNs)應(yīng)用于語音識別領(lǐng)域。深層神經(jīng)網(wǎng)絡(luò)(DNNs)基于過去錄入的數(shù)百萬音頻片段樣本,對輸入的語音進行分析,將其轉(zhuǎn)為候選文本。通過該技術(shù),語音識別錯誤率可降低30%左右。
語音被轉(zhuǎn)換為文本后,下一步將是文本校正,如去除口語中的不連貫字詞(如“啊”、“嗯”及其他重復(fù)措辭),將文本分解成句子,添加標(biāo)點符號及大小寫識別等一系列處理。“處理后得到的文本會進入一個由機器學(xué)習(xí)方法建立的統(tǒng)計機器翻譯系統(tǒng)中,逐詞和逐句進行翻譯。系統(tǒng)會從各個維度(如,語言模型、翻譯模型和調(diào)序模型)對候選譯文進行打分和排序,終輸出一個佳翻譯。而這些模型需要使用海量規(guī)模,不同類型和不同領(lǐng)域的數(shù)據(jù)來進行訓(xùn)練。整個Skype Translator的中文文本到英文文本的自動翻譯系統(tǒng)由微軟亞洲研究院自然語言計算團隊經(jīng)過多年努力開發(fā)完成,其水平目前可謂頂尖可處理口語現(xiàn)象的翻譯系統(tǒng)。”微軟亞洲研究院首席研究員周明表示。
機器翻譯完成后,便是決定Skype Translator用戶體驗的核心環(huán)節(jié)——語音合成。其關(guān)鍵點在于,將機器翻譯完成的文字內(nèi)容轉(zhuǎn)化成自然的語音。張益肇表示,微軟的研究人員還在努力提升合成后語音在情緒上的表達(dá),以及說話時的抑揚頓挫。據(jù)悉,語音合成的所有項目均由微軟在中國的研發(fā)團隊完成,包括微軟將近三十多種語言的語音合成引擎。
除了技術(shù)上的深度投入外,Skype Translator還十分重視用戶反饋及功能細(xì)節(jié)改進。基于Skype每月?lián)碛械?億活躍用戶,與用戶深入交流,根據(jù)他們的使用反饋,不斷提升產(chǎn)品的用戶體驗,是Skype一直努力在做的事情。據(jù)Vikram Dendi介紹,Skype Translator中文預(yù)覽版所新增的不少新功能點,很多都來自于用戶對以往版本的使用反饋。比如,新增了多種用戶交流方式。之前的版本用戶只限于文本間或語音間交流,現(xiàn)在則更加靈活,可以通過設(shè)置實現(xiàn)語音到文本的交流;還有,根據(jù)用戶對干擾Skype Translator無法理解說話內(nèi)容的情況反饋,而增加了新的輔助選項,發(fā)出提示引導(dǎo)用戶通過不同的嘗試解決這一問題。Vikram Dendi同時也希望獲得更多中國用戶的真實反饋,以進一步完善該技術(shù)。
目前Skype Translator已支持西班牙語、意大利語、中文(普通話)和英文四種語言的語音翻譯功能。雖在某些方面仍有不足,但在拉近人與人之間的距離、節(jié)省溝通成本上確實邁出了重要一步!
本站文章版權(quán)歸原作者及原出處所有 。內(nèi)容為作者個人觀點, 并不代表本站贊同其觀點和對其真實性負(fù)責(zé),本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。本站是一個個人學(xué)習(xí)交流的平臺,網(wǎng)站上部分文章為轉(zhuǎn)載,并不用于任何商業(yè)目的,我們已經(jīng)盡可能的對作者和來源進行了通告,但是能力有限或疏忽,造成漏登,請及時聯(lián)系我們,我們將根據(jù)著作權(quán)人的要求,立即更正或者刪除有關(guān)內(nèi)容。本站擁有對此聲明的最終解釋權(quán)。