LiveCaptionN 將您的 Android 手機變成即時語音字幕和翻譯工具,它可以懸浮在任何其他應用程式之上。它透過麥克風或目前播放應用程式的音訊進行監聽,逐字逐句地轉錄您說話的內容,將其翻譯成您選擇的語言,並將結果以可拖動的字幕視窗的形式顯示在您正在觀看、瀏覽或學習的任何內容之上。
預設情況下,該流程的兩個部分都在設備端完全運作:
• 串流 Vosk 語音辨識 — 一個長壽命辨識器持續接收約 100 毫秒的音訊片段,因此字幕幾乎是即時顯示的,而不是以 2 秒的片段形式出現。
• Google ML Kit 裝置端翻譯 — 支援約 59 種語言,每種語言對只需一次性下載約 30 MB 的數據,然後永久快取離線。
無需帳戶。不收集遙測數據。預設流程無需伺服器。
功能特性
• 懸浮式字幕疊加層,可置於任何應用程式之上,支援拖曳移動、捏合縮放、暫停、最小化和關閉等操作
• 支援麥克風或系統音訊(透過 MediaProjection),皆採用低延遲傳輸
• 裝置端 Vosk 串流辨識器,體驗媲美 Google Live Caption
• 內建下載器,提供更多設備端 Vosk 模型,兩種品質等級:小型(約 30 至 80 MB)和大型伺服器等級(80 MB 至 2 GB,錯誤率最低),支援西班牙語、法語、德語、義大利語、葡萄牙語、荷蘭語、俄語、烏克蘭語、波斯語、印地語、中文、日語、阿拉伯語
• 透過 Google ML Kit 進行裝置端翻譯,可選配 LibreTranslate 作為伺服器後端,以覆蓋更廣泛的語言
• 可直接在應用程式內搜尋轉錄歷史記錄
• 可調整疊層:文字大小、不透明度、寬度、高度、螢幕位置記憶
• 透過 GitHub Releases 自動接收更新通知API
隱私至上
LiveCaptionN 不會建立帳戶,不會追蹤您的活動,也不會進行任何分析。語音辨識和翻譯功能均可在您的手機上運作。該應用程式僅在您要求時才會存取互聯網,以下載 Vosk 模型(來自 alphacephei.com)和 ML Kit 翻譯對(來自 Google 的模型服務),並檢查 GitHub 上是否有新的版本發布。如果您在設定中啟用選購的 Whisper 或 LibreTranslate 伺服器,流量將隻流向您配置的 URL,且不會流向其他任何網站。
系統需求
• Android 10(API 29)或更高版本
• 麥克風權限(用於麥克風模式)
• 「在其他應用程式之上顯示」權限(用於浮動字幕視窗)
• 通知權限(用於可選的更新提醒)
LiveCaptionN 完全開源。每個版本都由 GitHub Actions 基於您可以查看的公開提交構建。歡迎在 GitHub 上提交問題、回饋和拉取請求。
Last updated on 2026年06月30日
Bug Fixes