nba魔术师约翰逊
咨詢電話:13704328194
詳細內容

百度全面解析機器同傳挑戰、前沿與展望

發布時間:2019/5/29 9:21:46 瀏覽次數:1824

翻譯為人類重新建立交流的巴別塔,機器翻譯則讓無障礙溝通的門檻降得更低。5月26日,2019自然語言處理前沿論壇上百度人工智能技術委員會主席何中軍博士帶來“機器同傳:進展與展望”的主題演講,并現場使用了“百度翻譯AI同傳”這一語音到語音的全新同傳產品。

據介紹,全新百度翻譯AI同傳小程序僅需掃碼即可使用,同傳直播頁支持邊聽邊看,體驗更實時、流暢。采用云端接入方式,無需傳統的同傳設備,降低會議成本。此外,會后同傳記錄還可以一鍵同步網盤,方便隨時查看。

機器同傳:機遇與挑戰并存

機器同傳成為人工智能領域前沿研究方向之一。隨著語音和機器翻譯技術的進步,機器同傳取得了較大進展,也面臨著一系列挑戰:

挑戰一:語音識別錯誤。由于演講者的口音、語速以及會場的噪聲影響,語音識別通常會存在一定的錯誤率,這錯誤會在翻譯中進一步放大。解決這一問題,需要從兩方面下功夫,一是高質量的語音識別系統,二是具有容錯能力、高魯棒性的翻譯模型。

挑戰二:質量與時延的平衡。同傳最具魅力的地方在于其低時延,但高質量翻譯和低時延之間存在天然矛盾。要想獲得高質量的翻譯,需要等待演講者更多的信息,時延就會變長。目前,幾乎所有的“實時”翻譯系統仍然使用傳統的全句(即,非同時的)翻譯方法,造成至少一個句子的延遲,使得譯文與說話者不同步。

挑戰三:翻譯的連貫性和一致性。目前,幾乎所有的翻譯系統都是以句子為單位進行翻譯的,句子與句子之間連貫性較差。同傳的主要場景是對演講者的內容,進行實時翻譯,需要保證翻譯前后內容的連貫和一致。

挑戰四:訓練數據不足。在語音領域,有數十萬小時的訓練數據;在機器翻譯領域,有數十億句對的訓練數據。然而,面向真實場景的同傳數據,只有幾十到幾百個小時,遠遠不足以訓練高質量的同傳系統。

挑戰五:評價指標的挑戰。在文本翻譯任務中,一般根據翻譯句子的流利度(語序)和忠實度(完整翻譯)對結果進行評價。同傳不同于筆譯,可以有足夠的時間去構思、推敲,同聲傳譯要求譯員在極有限的時間內對接受到的信息進行重組,使目的語聽眾了解原語發言人的講話內容。因此,會采用“順句驅動”“合理簡約”等方法。傳統的評價文本翻譯的指標不適用于評價同傳的結果。

百度翻譯AI同傳集成了百度在同傳上的最新技術,在語音容錯、可控時延、篇章翻譯、端到端模型等方面都提出了創新的解決方案。

在語音容錯方面,為提高翻譯的準確度和魯棒性,百度提出了“聯合文本和拼音編碼”的語音翻譯模型(Robust Neural Machine Translation with Joint Textual and Phonetic Embedding)。這一模型的創新之處在于對文本和拼音進行聯合編碼,緩解語音識別帶來的錯誤。比如,發音都是“datang”的“大堂”和“大唐”很容易令語音識別系統混淆。傳統的翻譯模型只使用了文本信息進行編碼,百度提出的模型在編碼端加入了音節信息,使得模型具有容錯能力。

在實時性方面,人工同傳可以很好的處理質量與時延的平衡。從人類譯員那里獲得靈感,百度提出了具有預測和可控時延的翻譯模型(STACL: Simultaneous Translation with Integrated Anticipation and Controllable Latency)。在這個模型中,在等待講話者開始后的第K個詞,就開始翻譯。模型在每個步驟使用源語句的可用前綴,以及到目前為止的翻譯來決定翻譯中的下一個單詞。該模型一個顯著的優點是其具有可調節性,實際使用中可以根據需要調節K值,以平衡翻譯質量和時間延遲。

在語篇翻譯方面,百度提出了基于多輪解碼校對網絡的篇章翻譯模型(Modeling Coherence for Discourse Neural Machine Translation),用于解決篇章翻譯過程中的一致性和連貫性問題。該模型首先進行第一輪解碼根據單個句子生成初步的翻譯結果,其后根據已經生成的上下文信息,對翻譯結果進行第二次解碼,重新調整翻譯內容。并且利用深度增強學習的技術,調整當前句子的譯文和已經生成的譯文保證良好的連貫性和一致性,在譯文的整體流暢性上取得顯著提高。

在端到端機器同傳模型方面,百度提出基于知識蒸餾的同傳模型(End-to-End Speech Translation with Knowledge Distillation)。首先利用大規模文本翻譯語料訓練一個教師模型,然后利用端到端語音翻譯訓練語料中的源語言轉錄文本和目標語言翻譯文本對教師模型進行微調(fine-tune)。在微調的過程中,利用知識蒸餾技術(Knowledge Distillation)對端到端語音翻譯的學生模型(Student Model)進行預測分布修正。該模型可以有效克服數據稀疏問題,顯著提升翻譯質量。

“未來,機器同傳可以從以下三個方面開展工作,在模型方面,研究高魯棒、低時延的同傳模型;在數據方面,建設大規模面向真實場景的同傳數據;在評價方面,建立面向同傳的評價體系和標準。” 何中軍表示。

層出不窮的網絡新詞,難以理解的語境,讓機器翻譯還不能做到“信達雅”,但隨著技術的發展,機器翻譯也在不斷進化。為推動機器同傳技術發展,百度翻譯聯合CCMT2019(全國機器翻譯研討會)推出全球首個面向真實場景的中英同傳評測任務(http://ccmt2019.jxnu.edu.cn/page/main1923/pctz.htm),同時發布了首個真實演講場景的中英同傳數據集CCMT2019-BSTC(http://ai.baidu.com/broad),兩項工作都將極大地推動同聲傳譯的相關研究和發展。

“有一天,當你在北京人民大會堂和世界各國友人聚會的時候,你會發現,無論哪個國家的人在臺上講話,與會者都能從耳機里聽到自己國家的語言……” 這是54年前,劉涌泉、高祖舜、劉倬合著的《機器翻譯淺說》里對未來的機器翻譯發展和應用的暢想和展望。而今天,隨著技術的進步,暢想正在逐步走向現實。百度翻譯AI同傳解決方案的提出,提供了一種更方便、成本更低的服務選擇,而未來,隨時隨地自由溝通的夢想也將離我們越來越近。

文章來源于互聯網

nba魔术师约翰逊 山西快乐10分 东方6+1 淘宝股票代码 600567股票行情 av女优苍井空电影下载 山西快乐10分 快乐双彩 腾讯大盘 北京十一选五 伊利股份股票分析报告 2006西班牙足球直播 好运彩3 上证指数4600点 股票配资平台选哪个 乳交a片 云南快乐10分