1. <tbody id="szdtk"></tbody>
        >科技>>正文

        百度宣布AI同傳最新突破!能預測,低延時,演示效果驚人,外媒稱媲美人類翻譯

        原標題:百度宣布AI同傳最新突破!能預測,低延時,演示效果驚人,外媒稱媲美人類翻譯

        夏乙 栗子 乾明 一璞 發自 三區五地

        同傳AI,剛剛在國內掀起過暴風驟雨。

        但現在,百度于硅谷宣布了最新重大突破——一個名為STACL的同傳AI,論文結果優異,Demo效果驚人。

        MIT科技評論、IEEE Spectrum等一眾外媒,還紛紛給出好評,這是2016年百度Deep Speech 2發布以來,又一項讓技術外媒們如此激動的新進展。

        百度自己披露:與現在大多數AI“實時”翻譯系統不同,STACL的特點是能預測延時可控,能夠在演講者講話后幾秒鐘開始翻譯,并在句子結束后幾秒鐘內完成。

        STACL不走“整句說完再翻譯”的路線,甚至還會預測發言者未來幾秒的內容,于是延時更短,更接近人類同傳。

        究竟能達到什么程度?IEEE Spectrum采訪后給出類比:跟聯合國會議里的人類同傳相媲美。

        實際效果果真如此?那突破顯然重大。

        Demo展示:翻譯AI會預測

        看上去幾乎同時了

        Demo可以看出,百度STACL的翻譯工作延時非常短,與原句只差幾個字。

        雖說這個AI目前只是同步翻譯成文字,還沒有合成譯文的語音,但這不是重點。關鍵是,不知道你有沒有注意到,這種“只差幾個字”有多難得。

        還沒等“美國總統布什在莫斯科與俄羅斯總統普京在莫斯科會晤。”這句漢語說到莫斯科,自動翻譯的英語已經出現了“meet”,也就是漢語句末的“會晤”。

        這個“meet”,是AI從前半句話里腦補出來的,依據的是美國總統最可能與其他人發生怎樣的活動。

        因此,百度這個同傳AI,不用等一句話說完,就能開始翻譯了。

        對于翻譯AI來說,預測是一項很罕見的技能。不同語言的語序總有差異,所以,那些沒有預測能力的翻譯AI,通常需要等到人類講完一句話,再開始翻譯。

        再舉一個栗子 (下圖) ,從“百度在18年前”這半句里,AI預測出了百度創立的內容“started a business”。

        那么,科學地講,百度AI的預測效果到底怎么樣?

        衡量翻譯質量,要看BLEU分。

        中譯英延后5個字的情況下,比起傳統的整句翻譯AI,百度的BLEU分要低了3.4分。

        畢竟是預測,發生錯誤是自然的。而這個差距在百度看來是可以接受的。

        比如,百度AI可能從前半句話里預測出會面順利進行,而事實可能是會面并不順利。翻譯就容易出現失誤。

        面對這樣的情況,AI目前并沒有糾錯的能力。

        不過,用小小的延時,就可以換取更高的準確度:如從延3個詞到延5個詞。用戶可以根據需求隨意調整。

        中英語序相似

        而當兩種語言語序相差不多的時候,例如描述戴安娜王妃車禍事件的新聞,STACL和傳統整句翻譯的成績相比,就沒有明顯差異了。

        這種預測能力,是哪來的?

        答案是一個名叫wait-k的模型,它把預測和翻譯無縫整合到了一起,百度把它和兩個翻譯模型結合起來做了實驗,一個是比較早期的RNN翻譯模型,另一個是Google在2017年推出即大熱的Transformer。

        不過,wait-k不僅僅適用于這兩個模型,而是可以用在任何序列映射(sequence-to-sequence)模型上。也就是說,只要有個模型能搞定兩種語言之間的翻譯,加上這個wait-k做一點小改造,就能實現同傳了。

        一個機器翻譯系統,離不開分析輸入語言的編碼器和輸出目標語言的解碼器,而wait-k對機器翻譯模型所做的小改動,就在解碼器上。它讓解碼器在輸出內容的同時,能預測編碼器還沒有輸入的東西。

        百度用這樣一個公式描述了這種解碼策略:

        其中,x代表輸入的內容,y代表輸出,t代表時間步,而k表示的是解碼器比編碼器搶跑的詞數。

        技術細節在論文STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency中有詳細的介紹。

        地址:https://arxiv.org/abs/1810.08398

        團隊介紹

        By the way,按署名次序,介紹一下9位論文作者。

        Mingbo Ma,百度硅谷AI實驗室科學家,擁有三個學校的計算機博士學位,今年8月剛從俄勒岡州立大學博士畢業,另外兩個學位在美國東北大學和紐約城市大學,本科畢業于吉林大學,此前曾在蘋果和IBM實習。

        黃亮,俄勒岡州立大學助理教授,百度美研首席科學家,此前曾就職于IBM和谷歌,并在紐約城市大學、南加州大學擔任過助理教授,博士畢業于賓夕法尼亞大學。

        Hao Xiong,愛丁堡大學計算機碩士,本科畢業于河海大學,2015年加入百度任軟件工程師,負責大容量數據處理系統和資源調度系統。

        Kaibo Liu,俄勒岡州立大學助理研究員,今年6月剛到百度實習,本科畢業于北大。

        Chuanqiang Zhang,低調的百度技術員工,目前無更多資料。

        何中軍,百度主任架構師,從事機器翻譯研究與開發十余年,多篇論文發表在本領域權威國際會議ACL、EMNLP、COLING、AAAI等,參與項目曾獲2015年度國家科學技術進步獎二等獎。

        Hairong Liu,百度硅谷AI實驗室科學家,曾就職于三星和普渡大學,華中科大電子電氣博士。

        Xing Li,中科院自然語言處理和機器學習碩士,百度硅谷人工智能實驗室的高級經理,曾任英特爾技術leader,在百度擔任過技術工程經理,領導百度貼吧研發團隊。

        王海峰,百度高級副總裁,e-Staff,百度AIG負責人、百度研究院院長,哈工大計算機博士。

        王海峰 第一波評價

        百度這次技術突破宣布后,首先在外媒引發報道。

        有好評。其中評價最高的是IEEE Spectrum,認為百度開發的這個新系統,揭示了一種通過預測未來而保持穩定的翻譯工具,可以與聯合國會議期間提供同傳服務的口譯人員相媲美,讓人們離軟件巴別魚又近了一步。

        有對比。比如將百度的這次突破與谷歌聯系起來。南華早報評論:隨著百度新的翻譯系統亮相,百度向谷歌發起了挑戰。

        還有將百度和谷歌放一起當“耦合”的。Engadget觀點:

        雖然這個系統仍舊有局限性,而且無法在必要的時候取代人類翻譯。但是它在谷歌缺席中國的情況下,給出了一種新的選擇。

        SiliconANGLE則援引分析師評論稱:“亞洲的語言翻譯方面仍然存在一定的局限性,看到本地的玩家加入到這個游戲中來,的確是一件好事。”

        但目前最多的態度是觀望。

        在技術宅密度比較高的Hacker News和Reddit上,百度的這條消息,并沒有引發太多的討論。

        截至早上7點40分,Reddit只有一條評論,Hacker News上有兩條評論——雖然這個消息發布已有5個多小時。

        Reddit上面的一條評論有點“水”,只是說這個Demo很好。

        Hacker News的兩條評論中,一條比較有技術含量,提出了如何翻譯德語的問題,并給出了一些示例,另一條是說,這個Demo很好。

        比較有趣的是,兩個說這個Demo很好的網友,昵稱基本上是一樣的。

        不過這個技術到底好不好,更多中外關注者馬上都能給出判斷。

        因為百度最快會在下周的年度技術大會上,進行公開展示。

        究竟是重大突破,抑或還只是完美Demo,到時一看便知。

        當然,有科研實力有技術復現的同學,現在就能去試試了。

        歡迎反饋你的測后評價~

        返回搜狐,查看更多

        責任編輯:

        聲明:該文觀點僅代表作者本人,搜狐號系信息發布平臺,搜狐僅提供信息存儲空間服務。
        閱讀 ()
        投訴
        免費獲取
        今日推薦
        体彩快中彩中奖规则

            1. <tbody id="szdtk"></tbody>

                  1. <tbody id="szdtk"></tbody>