百度推出 AI 語音轉文字應用 SwiftScribe

百度近日宣佈推出 SwiftScribe,一個可以用人工智能轉換錄音頻檔案的應用。

過去幾年百度一直在研究其 DeepSpeech 軟體的語音識別。去年還推出了 TalkType,這是一個使用 DeepSpeech 的 Android 鍵盤。事實上,Amazon、Apple、Google 和 Microsoft 都一樣在研究語音識別,但他們都沒有解決較長時間音頻的轉錄問題。

30 秒檔案只需 10 秒
在 SwiftScribe 中,用戶要選擇以 .wav 或 .mp3 格式上傳檔案,系統便會自動處理。30 秒的檔案只需 10 秒就能完成轉錄,一分鐘的檔案只需不到 30 秒。「SwiftScribe 甚至可以處理任意文件中長達一小時時長的音頻,但需要花費 20 分鐘的時間來處理」,百度項目經理田武表示。

目前,SwiftScribe 會是百度的一項免費服務,不過田武表示在未來希望將它變成一項業務。

目前的語音轉文字軟體不是所有語言都可轉換,最常見的只有英文,而目前在百度的網站上示範的亦是英文,未知若語音檔是中文,會如何處理。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *