思绪随口说,
记录别再戳。
Sumi 听你说的话, 写出你真正想表达的。
Sumi 实际应用场景
真实情境,真实效果。
一键开口说
按下 Option+Z 开始说话,Sumi 自动录音、转录、润饰 — 一气呵成。

邮件自己写好
自然说话,立刻得到一封专业邮件。不需要手动修改。

每个 App,你的语气
同一句话,不同输出。Sumi 自动调整语气来匹配每个 App。
部署进度如何?有遇到什么问题吗?
各位好 — 部署已完成,所有系统运作正常。如有任何问题请随时反馈。

你的规则,你的风格
内置多款热门 App 预设规则,也能自定义你专属的风格。

跟你的 AI Agent 说话
对 Gemini、Claude Code 或 Codex 直接说话 — 不用再在终端之间切换键盘。
适用于你的每一个 App
Sumi 兼容任何平台上的应用程序,情境感知 AI 自动调整文风。
…以及你使用的所有应用程序。能打字的地方,Sumi 就能用。
Sumi 与竞品比较
唯一开源、且支持完全本地端 AI 润稿的语音工具。
| 功能 | Sumi | Wispr Flow | VoiceInk | SuperWhisper |
|---|---|---|---|---|
| 价格 | 免费 | $12–15/月 | $39.99 | $10/月 |
| 本地语音识别 | Whisper + Metal | 仅限云端 | ||
| 云端语音识别 | 自带密钥 | 选配 | ||
| AI 文字润饰 | ||||
| 本地 LLM 润稿 | 唯一支持 | |||
| 自定义提示词 | 按 App 设定 | 自定义模式 | ||
| 情境感知 | App + 网址 | App | 手动模式 |
数据来源为各产品公开信息,功能可能已有变动。
早期用户的好评
听听开发者和创作者怎么说。
“我边调试边用 Sumi 口述代码注释和 Slack 消息。本地 LLM 润稿超强 — 语无伦次也能变成干净的文字,完全不经过云端。”
“Sumi 让我的初稿效率提升一倍。情境感知功能会自动调整 email 和聊天的语气 — 就像有个私人编辑。”
“完全开源是我选择 Sumi 的决定性因素。我可以验证音频绝不会离开设备,没有其他语音工具能给我这种信任感。”
“我现在完全用语音写论文。中英文混着讲也没问题,省下好几周的打字时间。”
“身为 PM,我在站会结束后直接口述会议摘要。走回座位时,润饰过的笔记已经贴在 Notion 里了。”
“我边调试边用 Sumi 口述代码注释和 Slack 消息。本地 LLM 润稿超强 — 语无伦次也能变成干净的文字,完全不经过云端。”
“Sumi 让我的初稿效率提升一倍。情境感知功能会自动调整 email 和聊天的语气 — 就像有个私人编辑。”
“完全开源是我选择 Sumi 的决定性因素。我可以验证音频绝不会离开设备,没有其他语音工具能给我这种信任感。”
“我现在完全用语音写论文。中英文混着讲也没问题,省下好几周的打字时间。”
“身为 PM,我在站会结束后直接口述会议摘要。走回座位时,润饰过的笔记已经贴在 Notion 里了。”
“多语言支持太强了。我用三种语言口述翻译,Sumi 的语码转换完美无缝。”
“通勤时用语音就把节目笔记写完了。以前要花一小时的事,现在十分钟搞定。”
“每天回复 50 多封 email 以前让我精疲力竭。现在只要自然地说,Sumi 就给我专业又精炼的回复。”
“在 Figma 工作的同时用语音记录设计决策。情境感知润饰会自动帮我调整成适合 Wiki 的正式语气。”
“以前不可能一边跑分析一边写报告。现在我边写代码边口述分析结果 — Sumi 帮我搞定后面的事。”
“多语言支持太强了。我用三种语言口述翻译,Sumi 的语码转换完美无缝。”
“通勤时用语音就把节目笔记写完了。以前要花一小时的事,现在十分钟搞定。”
“每天回复 50 多封 email 以前让我精疲力竭。现在只要自然地说,Sumi 就给我专业又精炼的回复。”
“在 Figma 工作的同时用语音记录设计决策。情境感知润饰会自动帮我调整成适合 Wiki 的正式语气。”
“以前不可能一边跑分析一边写报告。现在我边写代码边口述分析结果 — Sumi 帮我搞定后面的事。”
开源项目
核心功能免费使用。喜欢 Sumi?用行动支持我们。
支持开源
每一个小动作,都是对开源社区最大的支持。
常见问题
关于 Sumi 你想知道的一切。
核心功能免费使用 — 本地转录、AI 润稿、情境感知、100+ 种语言。Sumi 以 GPLv3 开源,你随时可以查看和自行编译代码。
Sumi 可完全离线运行。语音识别使用设备上的 Whisper 搭配 Metal GPU 加速,AI 文字润饰可使用本地 LLM(Llama 3 / Qwen 2.5 / Qwen 3)。你的录音和文字永远不会离开你的设备,除非你主动选择使用自己的 API 密钥连接云端服务。
macOS:需要 macOS 13(Ventura)或更新版本,搭配 Apple Silicon(M1/M2/M3/M4)或至少 8 GB 内存的 Intel Mac。推荐使用 Apple Silicon 以获得 Metal GPU 加速。Windows:需要 Windows 10 或更新版本(x64)。CPU 版本适用于所有电脑;CUDA 版本需要支持 CUDA 的 NVIDIA 显卡,可获得更快的转录速度。
转录完成后,Sumi 会自动移除赘字(嗯、啊),修正语法,并根据你正在使用的 App 调整语气。你可以使用设备上的本地 LLM 进行润饰,也可以用自己的 API 密钥连接 OpenAI 或 Groq 等云端服务来获得更快的结果。
Sumi 适用于任何可以打字的应用程序 — Slack、Notion、VS Code、Gmail、Chrome、Safari、Discord 等数百款 App。它是一个系统级工具,会根据你正在使用的 App 甚至网址来自动调整情境感知 AI 润稿。
支持!Sumi 现已支持 Windows(x64,Windows 10 以上)。提供两个版本:CPU 版本适用于所有电脑,CUDA 版本可使用 NVIDIA GPU 加速获得更快的转录速度。Linux 版本尚未推出。
选中任何文字,按下 Ctrl+Option+Z,然后说出指令,例如「翻译成英文」或「语气更正式一点」。Sumi 的 AI 会直接改写选中的文字 — 不需要手动复制粘贴。
当然!Sumi 在 GitHub 上以 GPLv3 授权完全开源。我们欢迎任何形式的贡献 — 无论是代码、Bug 反馈、翻译或文档改善。欢迎到我们的 GitHub 项目页面开始参与。