【蔡依璇、李台源、章倩萍/台北報導】AI自動生成客語摘金!客家公共傳播基金會「講客廣播電臺」的「AI客語語音廣播自動生成系統」奪下第59屆廣播金鐘獎「創新研發應用獎」。代表領獎的講客廣播電台工程組涂志豪,全程用海陸腔客語發表感言:「承蒙客家委員會的?手,承蒙客傳會、承蒙很多節目組的同事與工程組的同事,承蒙編輯部的同事,有你們的幫忙才有機會上台領獎。」

講客廣播電臺以客家委員會的「臺灣客語語音資料庫」為骨幹,透過人工智慧深度學習技術的大型語言模型(LLM),導入文字轉客語語音AI模型、客語語音自動辨識轉華語文字 AI 模型,將AI客語應用整合於講客廣播電臺後端網頁程式架構,打造出全球首個整合型AI客語語音生成應用環境。

協助系統建置的客傳會工程組的耿詩婷幽默地說:「從來沒有想過我當軟體工程師也可以得到金鐘獎,謝謝大家,謝謝客傳會,謝謝講客廣播電臺。」

工程師林昌明也說:「感謝客委會提供豐富的客語語料,因為客語現在是需要更多人來運用,我們要增加客語的媒體近用權,所以我們透過AI來更多人知道客語在廣播上的發展。這個項目符合聯合國SDG 4 優質教育與SDG 10 減少不平等,希望讓客語文化跟語言能在全球發展,讓更多人知道客語是很多人用的。」

客傳會「AI客語語音廣播自動生成系統」奪創新研發應用獎。宋佩遙攝

AI客語語音廣播自動生成系統整合多項創新技術,可統一在講客廣播電臺官網編輯臺,產生客語語音音檔,20秒即可生成250字的客語音檔,自動整合導入講客廣播電臺AI客語最速報,為客家媒體數位化新時代發展,樹立全新典範。

客傳會工程組組長涂志豪表示,「AI客語語音廣播自動生成系統」得以落地,首先要感謝客家委員會長期推廣客家語言發展、蒐集完善的語料,保存大量珍貴的客語聲音數據,才得以加速推進客語AI語音合成技術(text to speech AI)及語音識別(speech to text)技術,使客語AI語音合成技術,能夠將客語文字轉換為語音,為客語的傳承與推廣提供新的契機。

「AI客語語音廣播自動生成系統」是全球首創結合AI客語技術與網頁程式。透過 HTML5規格網頁,採用PHP 8.x 網頁程式與 JavaScript 技術,結合客語AI模型伺服器、網頁程式伺服器、資料庫伺服器與分散式網路運算架構,呈現創新的AI客語語音生成數位多媒體內容。

AI客語語音廣播在系統中會採用 ffmpeg 自動將數位客語音檔合成為單一音檔輸出給編輯系統使用。

講客廣播電臺團隊在網頁後臺編輯文字時,點選「AI客語音檔產生」功能選項,系統就會自動將文字切割為多段字元,分批連接客語AI模型伺服器,經過人工智慧系統即時運算,取得數段客語音檔,在網頁後臺系統自動透過 ffmpeg 程式庫合併音檔,系統會自動將檔案伺服器上的音檔連結,即時傳輸音檔位置給編輯後臺內文中,只要編輯出版文章,講客廣播電臺網站的前臺頁面,就會自動出現AI客語音檔。

深度學習的語音合成,自然度最高,需要大量語音數據和計算資源訓練,講客廣播電臺持續提供大量語音檔案,強化語音模型辨識度、合成精確度及強化轉換效率,除現有四縣及海陸外,未來將再逐步增加大埔、饒平、詔安等腔調識別與合成,提高 AI 客語模型的使用範圍和利用廣度,以新時代的風貌,落實客語的媒體近用權。

在網頁後臺編輯文字時,點選「AI客語音檔產生」功能選項,系統就會自動將文字切割為多段字元,分批連接客語AI模型伺服器,透過人工智慧系統即時運算。
只要編輯出版文章,《講客廣播電臺》網站的前臺頁面,就會自動出現AI客語音檔。

「AI客語語音廣播自動生成系統」 持續提升AI客語語音生成的成熟度。客語的多種不同腔調,可以藉由AI客語語音生成技術,提供客語學習者標準的發音示範,幫助學習正確的客語發音,AI客語語音生成技術延伸應用「新聞學客語」講客三分鐘新聞,提供精確時間碼(Time code)華客字幕對照,點擊文字即可到指定之段落聽到對應的客語音檔聲音,並可重複聆聽,實現直覺且快速的點讀體驗。

針對聽新聞學客語為重點功能的三分鐘新聞,本系統也整合音檔播放器程式碼、產生音檔波形的程式碼,即時在網頁中,以具備精確時間碼的對照字幕方式,呈現客語新聞聲音、客語文字或華語文字同步放送功能,方便閱聽人以最直覺的方式聽懂、看懂客語,透過生活化的熟悉新聞內容與語彙,點擊文字可跳至該段落的廣播音檔自動播放,透過 UI/UX 最佳化的直觀操作方式,增加客語學習便利性。

AI客語生成系統整合音檔播放器程式碼、產生音檔波形的程式碼,即時在網頁中,以具備精確時間碼 (Time code) 的對照字幕方式,呈現客語新聞聲音、客語文字或華語文字同步放送功能。

客傳會表示,「AI客語語音廣播自動生成系統」的目的,是為了突破語言藩籬,打造全球第一的AI客語語音生成應用環境。「AI客語語音廣播自動生成系統」將講客廣播電臺進行完整的線上線下整合。還可以廣泛應用於客語教育、媒體、出版、影視等領域,促進客語的社會應用,幫助記錄、保存客語的特色,保護客語文化的多樣性。

AI客語語音生成技術降低客語門檻,採實用與生活用語模式,讓更多人能夠邊聽客語、邊看文字,提升客語能力,擴大客語傳播效益,體現講客廣播電臺在創新應用研發上的軟實力。

AI客語語音生成的發展,不僅具有重要的文化意義,也具有廣泛的社會效益。AI客語語音生成,可以促進客語文化傳承,保護客語語言資源,增強客語使用者文化自信,促進客語文化繁榮發展。客語AI語音生成還可以打突破語言藩籬,促進族群語言文化的保存,實現聯合國提出的永續發展 SDG 4 優質教育與SDG 10 減少不平等 ,開啟保存語言文化的篇章,讓多元文化永續。