pyTranscriber：運用 Google 語音識別 API 幫您的影片快速且自動生成 .srt 字幕檔

■ 軟體檔案 ■

軟體名稱

pyTranscriber

軟體類別

工具

軟體性質

自由軟體

官方網站

https://github.com/raryelcostasouza/pyTranscriber

軟體下載

請到官方網站下載！

支援系統

Windows、Linux、MacOS

支援語言

英文

幫影片上字幕的人都知道，這是一件極為反復且無聊的工作，而且更應該是將來人工智慧需要解決的問題！一提到這種無聊的工作就應該給電腦來自動完成呀！其實早就有工程師運用 Python 程式語言寫出這樣的工具，也就是 Autosub，它運用 Google 語音識別 API 可以自動生成 .srt 字幕檔，不過使用它需要熟練指令並不是這麼容易，所以後來又有工程師寫出了 pyTranscriber，這樣就能使用友好的圖形用戶界面來辨識影片或聲音檔成 .srt 字幕檔，除此之外還附上一個 .txt 文字檔收錄辨識出來的文字。

Google 語音識別 API 其實也運用在 YouTube 的自動產生字幕中，不過中文始終不支援，大概是準確度還不夠的關係，但幸運的話仍可以達到 95 % 的準確度，當然要聲音夠乾淨且清楚！使用這個工具前一定要記住以下幾點事情：

一、AI 辨識語音不容許雜訊，所以輸入的影片音軌或聲音檔案請排除環境雜音與背景音樂，確保辨識結果不會差異過大。如果沒做好這點，辨識結果可能會非常讓你失望！（甚至一片空白）
二、現今對於中文的語音辨識準確度仍然需要改善，對句更是 AI 至目前為止都還沒非常完善的部分，因此辨識完畢生成的字幕檔仍需要人工調整，這邊建議使用 Aegisub 這款自由軟體進行字幕編輯。
三、由於使用的是 Google 語音識別 API，請保持網路連線。

辨識速度非常快！1 小時的影片可在 10 分鐘內完成辨識並輸出字幕檔案。讓我們來實作下載、安裝與辨識過程：

▲ 這個是 pyTranscriber 的 GitHub 頁面，這款工具軟體是完全開源的。

▲ 往下可以看到給使用者的區塊，點開連結。

▲ 支援 Windows / Linux / MacOS！這邊下載 Windows 安裝版。

▲ 使用者介面非常簡易，只要選擇輸入影片或聲音檔，接著選擇音頻的語言（這邊依照要辨識的語言來選擇），輸出目錄確認沒問題就可以點「Transcribe Audio / Generate Subtitles」來開始自動處理！

▲ 如果輸入的是影片檔就會先將影片音軌轉換成 FLAC 檔案給 Google 語音辨識 API 進行辨識唷！

▲ 這邊就是給 Google 語音辨識 API 進行辨識的階段，完成後會輸出 .srt 字幕檔與 .txt 文字檔。

▲ 使用 Aegisub 編輯軟體打開 .srt 字幕檔，再將影片導入就可以開始人工字幕編輯與修正，運氣好斷句就會斷得不錯只有少數錯字。（當然要看影片聲音品質而定啦）

▲ .txt 文字檔內收錄的是辨識結果的純文字，斷點換跳行。

希望未來會有更好的工具造福人類！影片字幕真的就是一個很不錯的方向，AI 加油！

贊助廣告 ‧ Sponsor advertisements

《上一篇》Telegram 5.14 for Android & Telegram Desktop 1.9.7 更新：投票 2.0（非匿名投票、複選投票、測驗模式）等

《下一篇》取得 WordPress Popular Posts REST API 熱門文章資訊至任何網頁 (AJAX 取得 JSON)

萌芽站長

您好，我是萌芽系列網站（Mnya Series Website）的站長&創始人，可以稱呼我「萌芽站長」。我的興趣與專長有登山、觀察地形、攝影、旅遊、網頁設計＆架設＆經營、動畫製作、圖片處理、資料彙整等。有任何問題或建議請至萌芽論壇發表。網站業務、商業合作的聯絡方式在「關於本站 → 團隊介紹 → 站長介紹」，很高興認識您！請多指教！

留言區 / Comments

萌芽站長

熱門文章

近期文章

頁面

其他操作