愛伊米

讓閩南語能直接譯成英語是怎麼做到的?工程師來揭秘

此前,Meta推出了全球首款以語音對語音的翻譯技術,讓閩南語能直接翻譯成英語。近日,參與此項技術開發的中國臺灣工程師陳鵬仁,透過線上的形式,分享了更多此項技術背後故事。

讓閩南語能直接譯成英語是怎麼做到的?工程師來揭秘

陳鵬仁

陳鵬仁表示,選擇閩南語作為第一個開發翻譯語言的原因,其實在於開發團隊中有不少熟稔閩南語的同仁,因此可以在更快時間裡驗證翻譯結果是否正確、通順。而為了打造能直接以語音對語音的翻譯技術,多達50人規模的開發團隊除了工程師,還包含語言學者、社會學家以及倫理學家等諸多跨學術團隊成員,以此研究目標翻譯語言背後結構與文化影響。例如美國所使用的英語與英國地區的英語雖然互通,卻有不少用字遣詞,或是發音上的差異。

讓閩南語能直接譯成英語是怎麼做到的?工程師來揭秘

Meta打造的翻譯系統

而閩南語其實也有類似情況,光是在臺灣、福建沿海地區,與馬來西亞、新加坡等地所使用的閩南語就有不少差異,甚至閩南語還有七聲八調的不同。此外,閩南語實際上沒有標準化的文字系統,加上各地區發音用詞上的差異,讓這個原本是以口語相傳為主的語言,更難以制式翻譯的方式轉換成其他語言。

陳鵬仁表示,實際上也是開始投入開發之後,才發現要順利將閩南語翻譯成其他語言,真的比想像中還難。先前說明中,Meta是透過閩南語的念音轉換成數字資料,然後將這些資料進行分類、標示,並且透過機器學習訓練,讓其他語言可以對應合適的翻譯結果。若其中有無法直接翻譯,或是難以呈現精準意思的情況,系統就會透過其他相近語言進行翻譯,並且將翻譯結果轉換成目標語言。

不過,目前此項技術仍受限演算法、學習資料內容等限制,因此僅能做到逐句翻譯,暫時還無法對應流暢的對話。但陳鵬仁預期在日後累積更多可用於訓練的語庫資料,加上演算法技術的持續進步,將能實現更即時的語音互譯效果。