導(dǎo)語:《紐約時報》網(wǎng)絡(luò)版周日刊文稱,Skype近期開始測試英語和西班牙語之間的實時語音翻譯,而谷歌也將對翻譯應(yīng)用進行升級。這表明,全球主要科技公司仍在繼續(xù)嘗試消除人們之間溝通的主要障礙,并已經(jīng)取得了不錯的成果。
以下為文章全文:
科技行業(yè)正在竭盡全力推翻阻礙全球之間相互交流的“巴別塔”。
上月,微軟旗下視頻通話服務(wù)Skype開始在英語和西班牙語用戶之間測試實時翻譯功能。預(yù)計不久之后,谷歌也將發(fā)布翻譯應(yīng)用的升級。谷歌翻譯的文字版目前提供了90種語言的翻譯,并且已經(jīng)能對少數(shù)幾種常用語言進行聽譯。在此次升級之后,這款應(yīng)用能自動識別用戶是否在講某種常用語言,并將其自動轉(zhuǎn)為文字。
這種將某一語言翻譯為另一語言的技術(shù)可能效果并不是很好。在使用該服務(wù)時,用戶需要佩戴頭戴式耳機,而只有當(dāng)說話者停下來靜聽對方正在說什么時,才能發(fā)揮最好的效果。整個體驗就像是兩名電話銷售員在使用對講機。
不過,在使用過程中,這樣的抱怨將會被“奇跡”帶來的震驚所取代。在幾分鐘時間里,我就習(xí)慣了這一流程,并與一名哥倫比亞人自由地討論他在麥德林的妻子、孩子和生活。Skype最開始曾將麥德林聽成了“Made A”,但隨后做出了修正。雙方溝通的最大障礙,即語言的差異,正在消失。
對語言的改進已經(jīng)成為在線產(chǎn)品優(yōu)化的關(guān)鍵一部分。這些服務(wù)利用了機器學(xué)習(xí)算法,使計算機不斷檢查結(jié)果,并做出相應(yīng)的調(diào)整。這將使在線拼寫檢查變得更加可靠,同時使搜索、地圖導(dǎo)航,以及其他在線服務(wù)越來越好。
我那位來自哥倫比亞的朋友塞巴斯蒂安·庫伯羅斯(Sebastian Cuberros)在Skype上表示:“在你對話的過程中,程序在進行學(xué)習(xí)。目前,這已經(jīng)很不錯。”盡管語法并不完美,但你能知道對方在說的是什么意思。
目前,只有幾千名用戶在Skype上使用該功能,而這一功能將從他們身上進行學(xué)習(xí)。此外,還有近4萬名用戶正在等待嘗試這一西班牙語和英語之間的翻譯服務(wù)。即使仍處于開發(fā)早期,但這帶來了許多的可能性,例如讓美國和墨西哥的兒童共同參加社會學(xué)習(xí)課程,或是對生活在敘利亞的家庭進行實時訪談。
谷歌表示,其翻譯應(yīng)用已被安裝在Android手機上超過1億次,而其中大部分都將收到谷歌推送的升級。“每月,在所有平臺上,我們的翻譯服務(wù)擁有5億活躍用戶。”谷歌翻譯工程主管邁克杜夫·休斯(Macduff Hughes)表示。由于全球80%至90%的網(wǎng)頁都只采用約10種語言,因此翻譯已成為了許多人進行學(xué)習(xí)的關(guān)鍵一部分。
谷歌Chrome瀏覽器已經(jīng)提供了一項功能,將網(wǎng)頁自動翻譯為某種主要語言。Chrome瀏覽器的用戶可以將一個英文頁面直接轉(zhuǎn)換為韓文等其他語言。此外,Gmail設(shè)置等頁面支持在約140種語言之間切換。
用戶可以將自己的電子郵件語言設(shè)置為克林貢語、海盜語和艾瑪語等搞怪的語言。其他一些小眾語言,例如切諾基語,并不是為了搞笑,而谷歌已實現(xiàn)了對這些語言的全面翻譯。谷歌還將發(fā)布一款服務(wù),在用戶拿起手機對準(zhǔn)國外街道上的標(biāo)志時,就能在屏幕上看到實時的翻譯結(jié)果。
微軟的必應(yīng)翻譯引擎被用于了Twitter和Facebook。Facebook運營著全球最大的照片分享服務(wù),涉及了多種語言。為此,該公司也在開發(fā)翻譯服務(wù)。此外,Skype的數(shù)千名用戶已注冊排隊,等待其他同步翻譯服務(wù)的推出,這些翻譯服務(wù)包括了漢語和俄語。
給“語料庫”加入更多數(shù)據(jù)對某些語言來說非常重要,而對機器學(xué)習(xí)算法的優(yōu)化也是如此。谷歌翻譯最初的語料庫數(shù)據(jù)來自人工翻譯。谷歌近期開始支持哈薩克語,而一名政府官員近期在電視機上呼吁人們給予幫助。休斯表示:“人們有著非常強烈的呼聲,要求我們將他們的語言納入到服務(wù)中。”
不過,一些專家仍然擔(dān)心,機器可能會深入學(xué)習(xí)語言的其他部分,例如聲調(diào)和幽默感。與搜索關(guān)鍵詞和Facebook“點贊”記錄類似,這些信息是否會被廣告主和司法部門所利用?
從事未來通信技術(shù)研究的Hypervoice Consortium聯(lián)合創(chuàng)始人凱利·菲茲西蒙斯(Kelly Fitzsimmons)表示:“技術(shù)可能擁有魔力,但帶來的威脅也真實存在。如果政權(quán)發(fā)生更替,而新政府不喜歡人們所說的話,那么這時語料庫信息意味著什么?”
菲茲西蒙斯表示,目前,只有不到1%的用戶愿意讓他們的數(shù)據(jù)被記錄。這可能是由于用戶愿意幫助機器學(xué)習(xí)翻譯,也可能發(fā)生在他們使用Siri等語音助手服務(wù)的過程中。她認(rèn)為,個人用戶將越來越擅長管理自己的個人隱私,而不是將隱私保護的責(zé)任都交給服務(wù)提供商。不過從目前來看,用戶更看重便利性。
Skype這一項目的產(chǎn)品營銷負責(zé)人奧利弗·馮塔納(Olivier Fontana)表示,在檢查翻譯質(zhì)量之前,會話已被分成了多個不同文件。他表示:“沒有辦法知道,什么人說過一些什么。美國國家安全局無法從中獲得有用的信息。”
休斯則表示,谷歌對于語音記錄非常謹(jǐn)慎。這部分是由于,隨著語音等生物信息安全方式取代傳統(tǒng)的密碼,這可能會帶來潛在的問題。除此之外,應(yīng)當(dāng)采取一些方式,讓翻譯語音與普通語音有所區(qū)別。例如,如果用戶說漢語,那么可以采用一種女性的聲音,使人們知道這是翻譯的內(nèi)容。(張帆)
原文鏈接:http://www.hbjjrb.com/kjzx/KJ/201501/743436.html
|