能自然地朗讀文字的Open Jtalk

Kenneth Mak's 的頭像
Printer-friendly versionSend by emailPDF version

提起電腦朗讀文字的功能,很多人都會馬上想到毫無感情的合成聲音。但這種狀況即將改變,日本名古屋工業大學的「德田、李研究室」開發的開源日語聲音合成引擎,將可用近似人聲的聲音朗讀出文章。

這個名為Open Jtalk的引擎早於2009年已經面世,最新版本是2011年12月25日發布的1.07。系統雖然只可以朗讀日文,但因為開源的關係,任何人都可參考其程式碼,然後加入屬於自己語言的特性,令朗讀文章時更為自然。下載後可在Windows上編譯,條件是系統已經安裝了Microsoft Visual C++ 2008或2010。不懂編譯的話,開發者亦提供了一個網站,讓大家可輸入不多於200字的內容給它朗讀。留意是輸入的內容只可以是日文,輸入英文的話系統將會將字母讀出。用戶可自由改變音質、音調和速度。

個人認為男聲比女聲自然得多了,用戶也可把生成的聲音檔案儲存。系統可以幫助公營設施或以聲音發布資訊,企業也可以把它應用在自動答話系統中,不需要找專人去朗讀。只希望恐怖份子不要利用它朗讀恐嚇信就好了。