Google 翻譯新增粵文(廣東話)在內的 110 種全新語言支援!

2024/06/28 15 1 網路應用 , 資訊新聞

Google 翻譯近日宣布,將新增包括粵文(廣東話)在內的 110 種全新語言支援,這是該服務有史以來最大的一次擴展。這些新增的語言將使超過 6.14 億人受益,約佔全球人口的 8%。Google 翻譯一直致力於打破語言障礙,讓人們能夠更好地互相理解和聯繫。為了達成這一目標,Google 持續採用最新的技術手段來擴展其語言支援範圍。早在 2022 年,Google 就透過「零範例機器翻譯」技術,新增了 24 種語言,這一技術允許機器在沒有見過任何範例的情況下學會翻譯。而這次新增的 110 種語言則依靠 PaLM 2 大型語言模型,顯示了 Google 在語言技術上的又一次重大突破。

這次新增的語言種類繁多,從粵文到 Qʼeqchiʼ,涵蓋了多達 6 億名使用者,這其中包括一些全球使用者超過一億的主要語言,也有一些是僅在小型原住民社區中使用的語言。尤其值得一提的是,這次擴展中約有四分之一的語言來自非洲,包括 Fon、Kikongo、Luo、Ga、Swati、Venda 和 Wolof,顯示出 Google 對非洲語言的高度重視。此次擴展還包括一些具有特殊意義的語言,例如在吉布提、厄立特里亞和埃塞俄比亞使用的聲調語言 Afar,由於社群志願者的大量貢獻,使得該語言得以加入支援列表。粵文(廣東話)一直是用戶最希望 Google 翻譯支援的語言之一,但由於其與普通話在書寫上的重疊,使得資料搜集和模型訓練變得困難重重。而在馬恩島幾乎滅絕的凱爾特語言 Manx,則因全島復興運動再次得到重視,並被納入這次的語言支援中。

Google 在選擇新增語言時,考慮了多種因素,包括語言的變體、區域性差異以及不同的拼寫標準。許多語言並沒有統一的標準形式,因此 Google 優先考慮了每種語言中最常用的變體。例如,羅姆語有多種方言,Google 翻譯的模型主要生成南部 Vlax 羅姆語的文本,但也混合了其他變體的元素,如北部 Vlax 和巴爾幹羅姆語。

PaLM 2 在這次擴展中發揮了關鍵作用,使得 Google 翻譯能夠更高效地學習彼此相關的語言,包括與印地語接近的 Awadhi 和 Marwadi,以及法語克里奧爾語如塞舌爾克里奧爾語和毛里求斯克里奧爾語。隨著技術的不斷進步,以及與語言專家和母語者的密切合作,Google 翻譯未來將支援更多語言變體和拼寫方式。


Google 翻譯首次加入粵文(廣東話)翻譯功能,讓看不懂粵文的台灣人可以輕鬆讀懂。

▲ 這次新增的語言幾乎讓 Google 翻譯支援的語言增加一倍,現在整個語言清單變得超多可以選擇,個人建議 Google 應該整理一下語言清單,實在太雜亂了!

贊助廣告 ‧ Sponsor advertisements

留言區 / Comments

萌芽論壇