pyTranscriber:運用 Google 語音識別 API 幫您的影片快速且自動生成 .srt 字幕檔

2020/01/23 5,721 1 軟體介紹 , 軟體應用 , 人工智慧 , AI語音
■ 軟體檔案 ■
軟體名稱
pyTranscriber
軟體類別
工具
軟體性質
自由軟體
軟體下載
請到官方網站下載!
支援系統
Windows、Linux、MacOS
支援語言
英文

幫影片上字幕的人都知道,這是一件極為反復且無聊的工作,而且更應該是將來人工智慧需要解決的問題!一提到這種無聊的工作就應該給電腦來自動完成呀!其實早就有工程師運用 Python 程式語言寫出這樣的工具,也就是 Autosub,它運用 Google 語音識別 API 可以自動生成 .srt 字幕檔,不過使用它需要熟練指令並不是這麼容易,所以後來又有工程師寫出了 pyTranscriber,這樣就能使用友好的圖形用戶界面來辨識影片或聲音檔成 .srt 字幕檔,除此之外還附上一個 .txt 文字檔收錄辨識出來的文字。

Google 語音識別 API 其實也運用在 YouTube 的自動產生字幕中,不過中文始終不支援,大概是準確度還不夠的關係,但幸運的話仍可以達到 95 % 的準確度,當然要聲音夠乾淨且清楚!使用這個工具前一定要記住以下幾點事情:

一、AI 辨識語音不容許雜訊,所以輸入的影片音軌或聲音檔案請排除環境雜音與背景音樂,確保辨識結果不會差異過大。如果沒做好這點,辨識結果可能會非常讓你失望!(甚至一片空白)
二、現今對於中文的語音辨識準確度仍然需要改善,對句更是 AI 至目前為止都還沒非常完善的部分,因此辨識完畢生成的字幕檔仍需要人工調整,這邊建議使用 Aegisub 這款自由軟體進行字幕編輯。
三、由於使用的是 Google 語音識別 API,請保持網路連線。

辨識速度非常快!1 小時的影片可在 10 分鐘內完成辨識並輸出字幕檔案。讓我們來實作下載、安裝與辨識過程:


▲ 這個是 pyTranscriber 的 GitHub 頁面,這款工具軟體是完全開源的。

▲ 往下可以看到給使用者的區塊,點開連結。

▲ 支援 Windows / Linux / MacOS!這邊下載 Windows 安裝版。

▲ 使用者介面非常簡易,只要選擇輸入影片或聲音檔,接著選擇音頻的語言(這邊依照要辨識的語言來選擇),輸出目錄確認沒問題就可以點「Transcribe Audio / Generate Subtitles」來開始自動處理!

▲ 如果輸入的是影片檔就會先將影片音軌轉換成 FLAC 檔案給 Google 語音辨識 API 進行辨識唷!

▲ 這邊就是給 Google 語音辨識 API 進行辨識的階段,完成後會輸出 .srt 字幕檔與 .txt 文字檔。

▲ 使用 Aegisub 編輯軟體打開 .srt 字幕檔,再將影片導入就可以開始人工字幕編輯與修正,運氣好斷句就會斷得不錯只有少數錯字。(當然要看影片聲音品質而定啦)

▲ .txt 文字檔內收錄的是辨識結果的純文字,斷點換跳行。

希望未來會有更好的工具造福人類!影片字幕真的就是一個很不錯的方向,AI 加油!

贊助廣告 ‧ Sponsor advertisements

留言區 / Comments

萌芽論壇