思緒隨口說,
紀錄別再戳。
Sumi 讓你的聲音即刻化身精準文稿。 本地或雲端任你選 — 聲音成字,由你作主。
你的聲音,你作主
完全彈性 — 選擇最適合你的運作方式。
離線自由
本地運行
使用 Metal GPU 加速的 Whisper 在裝置上直接轉錄。無需網路、無需上傳。
AI 在你的裝置上
使用本地 LLM(Llama 3 / Qwen 2.5)潤飾文字。所有處理都在你的裝置上完成。
資料零外流
語音錄音和文字永遠不會離開你的裝置。從設計上確保完全隱私。
完整功能,完全離線。
雲端彈性
自帶 API 金鑰
接入 Groq、OpenAI、Deepgram、Azure 或任何自訂端點,使用你自己的金鑰。
更快處理速度
利用雲端 API 獲得更快的轉錄速度與更強大的 AI 潤飾能力。
隨時切換
在本地與雲端模式之間無縫切換。不綁定、核心功能無需額外訂閱。
極致速度,極致選擇。
適用於你的每一個 App
Sumi 相容任何平台上的應用程式,情境感知 AI 自動調整文風。
…以及你使用的所有應用程式。能打字的地方,Sumi 就能用。
為何選擇 Sumi?
完美的語音體驗,兼顧效能與彈性。
極致隱私:純本地處理
使用 Metal GPU 加速在裝置上運行 Whisper。無需連網,敏感資料永遠留在你手邊。
智慧精簡:自動潤稿
自動過濾「嗯、喔」等贅字,修復語法缺失,並根據你正在使用的 App 調整語氣。
跨越國界:支援百種語言
快速辨識超過 100 種語言,具備強大的語碼轉換(Code-switching)能力,混著講也行。
開源精神:透明且持續
基於 Whisper 及開源 LLM 建構。可接入免費雲端供應商,也可完全離線運行 — 由你決定。
Sumi 與競品比較
唯一免費、開源、且支援完全本地端 AI 潤稿的語音工具。
| 功能 | Sumi | Wispr Flow | VoiceInk | SuperWhisper |
|---|---|---|---|---|
| 價格 | 免費 | $12–15/月 | $39.99 | $10/月 |
| 本地語音辨識 | Whisper + Metal | 僅限雲端 | ||
| 雲端語音辨識 | 自帶金鑰 | 選配 | ||
| AI 文字潤飾 | ||||
| 本地 LLM 潤稿 | 唯一支援 | |||
| 自訂提示詞 | 依 App 設定 | 自訂模式 | ||
| 情境感知 | App + 網址 | App | 手動模式 |
資料來源為各產品公開資訊,功能可能已有異動。
早期使用者的好評
聽聽開發者和創作者怎麼說。
“我邊除錯邊用 Sumi 口述程式註解和 Slack 訊息。本地 LLM 潤稿超強 — 語無倫次也能變成乾淨的文字,完全不經過雲端。”
“Sumi 讓我的初稿效率提升一倍。情境感知功能會自動調整 email 和聊天的語氣 — 就像有個私人編輯。”
“完全開源是我選擇 Sumi 的決定性因素。我可以驗證音訊絕不會離開裝置,沒有其他語音工具能給我這種信任感。”
“我現在完全用語音寫論文。中英文混著講也沒問題,省下好幾週的打字時間。”
“身為 PM,我在站會結束後直接口述會議摘要。走回座位時,潤飾過的筆記已經貼在 Notion 裡了。”
“我邊除錯邊用 Sumi 口述程式註解和 Slack 訊息。本地 LLM 潤稿超強 — 語無倫次也能變成乾淨的文字,完全不經過雲端。”
“Sumi 讓我的初稿效率提升一倍。情境感知功能會自動調整 email 和聊天的語氣 — 就像有個私人編輯。”
“完全開源是我選擇 Sumi 的決定性因素。我可以驗證音訊絕不會離開裝置,沒有其他語音工具能給我這種信任感。”
“我現在完全用語音寫論文。中英文混著講也沒問題,省下好幾週的打字時間。”
“身為 PM,我在站會結束後直接口述會議摘要。走回座位時,潤飾過的筆記已經貼在 Notion 裡了。”
“多語言支援太強了。我用三種語言口述翻譯,Sumi 的語碼轉換完美無縫。”
“通勤時用語音就把節目筆記寫完了。以前要花一小時的事,現在十分鐘搞定。”
“每天回覆 50 多封 email 以前讓我精疲力竭。現在只要自然地說,Sumi 就給我專業又精煉的回覆。”
“在 Figma 工作的同時用語音記錄設計決策。情境感知潤飾會自動幫我調整成適合 Wiki 的正式語氣。”
“以前不可能一邊跑分析一邊寫報告。現在我邊寫程式邊口述分析結果 — Sumi 幫我搞定後面的事。”
“多語言支援太強了。我用三種語言口述翻譯,Sumi 的語碼轉換完美無縫。”
“通勤時用語音就把節目筆記寫完了。以前要花一小時的事,現在十分鐘搞定。”
“每天回覆 50 多封 email 以前讓我精疲力竭。現在只要自然地說,Sumi 就給我專業又精煉的回覆。”
“在 Figma 工作的同時用語音記錄設計決策。情境感知潤飾會自動幫我調整成適合 Wiki 的正式語氣。”
“以前不可能一邊跑分析一邊寫報告。現在我邊寫程式邊口述分析結果 — Sumi 幫我搞定後面的事。”
透明且簡單的選擇
你可以自由選擇免費使用,或透過贊助支持開源社群長期發展。
社群開發版
適合個人創作者與開發者探索
專業贊助版
支持我們的開發計畫,並解鎖核心進階功能
常見問題
關於 Sumi 你想知道的一切。
是的。Sumi 是 100% 免費且開源的軟體,採用寬鬆授權條款。所有核心功能 — 本地轉錄、AI 潤稿、100+ 種語言 — 完全免費使用。選配的「專業贊助版」是給希望支持開發並優先體驗進階功能的使用者。
Sumi 可完全離線運行。語音辨識使用裝置上的 Whisper 搭配 Metal GPU 加速,AI 文字潤飾可使用本地 LLM(Llama 3 / Qwen 2.5)。你的錄音和文字永遠不會離開你的裝置,除非你主動選擇使用自己的 API 金鑰連接雲端服務。
Sumi 需要 macOS 13(Ventura)或更新版本,搭配 Apple Silicon(M1/M2/M3/M4)或至少 8 GB RAM 的 Intel Mac。推薦使用 Apple Silicon 以獲得最佳的 Metal GPU 加速 Whisper 體驗。
轉錄完成後,Sumi 會自動移除贅字(嗯、啊),修正語法,並根據你正在使用的 App 調整語氣。你可以使用裝置上的本地 LLM 進行潤飾,也可以用自己的 API 金鑰連接 OpenAI 或 Groq 等雲端服務來獲得更快的結果。
Sumi 適用於任何可以打字的應用程式 — Slack、Notion、VS Code、Gmail、Chrome、Safari、Discord 等數百款 App。它是一個系統級工具,會根據你正在使用的 App 甚至網址來自動調整情境感知 AI 潤稿。
當然!Sumi 在 GitHub 上完全開源。我們歡迎任何形式的貢獻 — 無論是程式碼、Bug 回報、翻譯或文件改善。歡迎到我們的 GitHub 專案頁面開始參與。