Google翻譯的一猛進展:即時鏡頭翻譯
。-> 翻譯社|,-> 翻譯公司|的-> 翻譯記者葉立斌/台北報導
為改良 NMT的翻譯品質,研究人員提出很多手藝來解決。這傍邊包羅透過模擬調校模子(external alignment model)處置懲罰罕有字詞、利用「注重」(attention)來對準輸入詞和輸出詞以及將詞拆解成更小的單位以應對罕有字詞等。從此以後,翻譯系統不再是片斷式 翻譯翻譯,而是一次翻譯全部句子,所以語意加倍流暢,且接近母語利用者說法 翻譯社藉由具有多層「神經元」(neurons)的「深度神經收集」(deep neural network),讓系統進修辨認句子中的模式和佈局,最後翻譯出語法更趨近日常談話、更順暢且易於浏覽的效果。
由於全球有跨越50%的網頁為英文網頁 翻譯公司而全球只有約20% 翻譯人口利用英語,是以Google 翻譯辦事有多達 95%的流量來自於美國之外 翻譯區域。如今更整合Gmail等多種利用程式,且利用者僅需在 Google 搜索列鍵入或用語音聲控輸入想要翻譯的內容,例如「OK Google,將「狗」翻譯成法文」便可履行翻譯 翻譯社所以翻譯內容的再進化是有必要的。
不外和人類一樣是需要練習的,若練習時僅以「乾淨」的字母作為範本,恐怕不合用。因為在實際世界中 翻譯字母可能會反射、有污垢、髒污以及因為各類因素受為了供應足夠的例子作為練習素材,Google 翻譯用「假」字母來摹擬各式反光、點來模擬實際糊口中圖片呈現的情境,以練習機械 翻譯演算法,並到達有用且密集的神經收集訓練。
十年前Google推出翻譯服務,並以片語式機械翻譯Phrase-Based Machine Translation、PBMT作為首要運算體例,運作體例是將句子切割成單獨 翻譯字和詞組做自力翻譯。從曩昔僅支援幾種說話,到現在可支援103種說話且天天翻譯跨越1400億個單詞。別的,Google 翻譯產品司理 Julie Cattiau表示,台灣是成長最快的市場,Android 版年成長2倍,iOS版年成長60%。
▲你是不是用過即時鏡頭翻譯呢?(圖/Google 供應)
另外一種神經收集運用的重點是各人經常使用 翻譯「即時鏡頭翻譯」(Word Lens) 翻譯社Google 翻譯利用程式必須從鏡頭拍攝的圖片中找出目的文字,透過深度進修手藝來辨識出每個文字,系統將在我們的字典中尋覓並轉換出翻譯了局。
今朝此系統已導入共 41 組語言組合,包孕英/中、英/泰、英/日,英/韓,英/俄羅斯等對譯。
Google有一項許多人利用 翻譯辦事「Google翻譯」在十年前推出,如果你和我一樣,從Google翻譯剛推出時便已使用,也許記得初期的英翻中語意相當僵硬、破裂,是以常有網友惡搞Google翻譯 翻譯社但如今你必然發覺紛歧樣了,不管是翻譯內容或功能都更像人翻的,這全仰賴人工聰明的提高 翻譯社
而從數年前,Google 採用遞歸神經收集(Recurrent Neural Networks、NMT)將句子視為一個單位進行翻譯,庖代過去的PBMT 翻譯社NMT僅需要較少 翻譯系統架構設計,也就是較簡單。
Google翻譯的下一步
Google翻譯 翻譯改變契機
Google翻譯的曩昔
提早截斷(Early cutoff): 合時地截斷或捨棄濫觞句子裡 翻譯單詞,增強數字與日期翻譯與簡短、罕有字串。最後是名詞與品牌翻譯。
來自: http://www.setn.com/News.aspx?NewsID=249966有關翻譯的問題歡迎諮詢華頓翻譯社