100% 开源・本地 + 云端・情境感知 AI

思绪随口说,
记录别再戳。

Sumi 听你说的话, 写出你真正想表达的。

GitHub 开源项目
macOS已上线
Windows已上线
iOS即将推出
Android即将推出
传统打字
45 wpm
Sumi
220 wpm
提升 4.8 倍生产力 —— 体验与思绪同步的快感
1 Stars
开源
100+ 种语言
Metal GPU 加速

Sumi 实际应用场景

真实情境,真实效果。

快捷键

一键开口说

按下 Option+Z 开始说话,Sumi 自动录音、转录、润饰 — 一气呵成。

Sumi Editor
Alice 咱们明天约在北京西站好了,额算了,改成国图。
⌥ Option
Z
一键开口说
Email

邮件自己写好

自然说话,立刻得到一封专业邮件。不需要手动修改。

跟 Alice 说我明天没法去吃午饭了,工作上临时有事,下午都要开会,看看能不能改到周四
Gmail— New Message
Subject午饭改期
Hi Alice, 我明天没法去吃午饭了,工作上临时有事,整个下午都在开会。 改到周四可以吗? Best
Send
邮件自己写好
情境感知

每个 App,你的语气

同一句话,不同输出。Sumi 自动调整语气来匹配每个 App。

跟团队说部署完成了,一切看起来都正常
# general
A
Alice11:38 AM

部署进度如何?有遇到什么问题吗?

Y
You11:42 AM

各位好 — 部署已完成,所有系统运作正常。如有任何问题请随时反馈。

LINE
A
部署好了没啊哈哈
好了!一切正常 🎉 有问题跟我说~
每个 App,你的语气
预设集

你的规则,你的风格

内置多款热门 App 预设规则,也能自定义你专属的风格。

Gmail专业正式
Slack简洁明快
VS Code技术精确
LINE轻松日常
Discord活泼有趣
Notion条理清晰
GitHub正式严谨
Telegram直接简短
+ 自定义规则
你的规则,你的风格
AI 开发

跟你的 AI Agent 说话

对 Gemini、Claude Code 或 Codex 直接说话 — 不用再在终端之间切换键盘。

Terminal
$ claude
> 🎤 "帮 upload function 加上 error handling"
我会在上传逻辑外面加上 try-catch,并为网络错误和文件验证加上合适的错误信息...
Gemini
Claude
OpenAI

适用于你的每一个 App

Sumi 兼容任何平台上的应用程序,情境感知 AI 自动调整文风。

Slack
VS Code
Gmail
Notion
Chrome
Safari
Discord
Telegram
Slack
VS Code
Gmail
Notion
Chrome
Safari
Discord
Telegram
Slack
VS Code
Gmail
Notion
Chrome
Safari
Discord
Telegram
Figma
Arc
Teams
iTerm2
GitHub
Linear
Obsidian
WhatsApp
Figma
Arc
Teams
iTerm2
GitHub
Linear
Obsidian
WhatsApp
Figma
Arc
Teams
iTerm2
GitHub
Linear
Obsidian
WhatsApp
LINE
Spotify
X
Reddit
YouTube
Zoom
Trello
Evernote
LINE
Spotify
X
Reddit
YouTube
Zoom
Trello
Evernote
LINE
Spotify
X
Reddit
YouTube
Zoom
Trello
Evernote

…以及你使用的所有应用程序。能打字的地方,Sumi 就能用。

Sumi 与竞品比较

唯一开源、且支持完全本地端 AI 润稿的语音工具。

价格
Sumi
免费
Wispr Flow
$12–15/月
VoiceInk
$39.99
SuperWhisper
$10/月
本地语音识别
Sumi
Whisper + Metal
Wispr Flow
仅限云端
VoiceInk
SuperWhisper
云端语音识别
Sumi
自带密钥
Wispr Flow
VoiceInk
选配
SuperWhisper
AI 文字润饰
Sumi
Wispr Flow
VoiceInk
SuperWhisper
本地 LLM 润稿
Sumi
唯一支持
Wispr Flow
VoiceInk
SuperWhisper
自定义提示词
Sumi
按 App 设定
Wispr Flow
VoiceInk
SuperWhisper
自定义模式
情境感知
Sumi
App + 网址
Wispr Flow
App
VoiceInk
SuperWhisper
手动模式

数据来源为各产品公开信息,功能可能已有变动。

早期用户的好评

听听开发者和创作者怎么说。

我边调试边用 Sumi 口述代码注释和 Slack 消息。本地 LLM 润稿超强 — 语无伦次也能变成干净的文字,完全不经过云端。

Alex Chen
Alex Chen
软件工程师

Sumi 让我的初稿效率提升一倍。情境感知功能会自动调整 email 和聊天的语气 — 就像有个私人编辑。

Sarah Kim
Sarah Kim
内容创作者

完全开源是我选择 Sumi 的决定性因素。我可以验证音频绝不会离开设备,没有其他语音工具能给我这种信任感。

ML
Marcus Liu
安全研究员

我现在完全用语音写论文。中英文混着讲也没问题,省下好几周的打字时间。

Emily Zhang
Emily Zhang
博士生

身为 PM,我在站会结束后直接口述会议摘要。走回座位时,润饰过的笔记已经贴在 Notion 里了。

David Park
David Park
产品经理

我边调试边用 Sumi 口述代码注释和 Slack 消息。本地 LLM 润稿超强 — 语无伦次也能变成干净的文字,完全不经过云端。

Alex Chen
Alex Chen
软件工程师

Sumi 让我的初稿效率提升一倍。情境感知功能会自动调整 email 和聊天的语气 — 就像有个私人编辑。

Sarah Kim
Sarah Kim
内容创作者

完全开源是我选择 Sumi 的决定性因素。我可以验证音频绝不会离开设备,没有其他语音工具能给我这种信任感。

ML
Marcus Liu
安全研究员

我现在完全用语音写论文。中英文混着讲也没问题,省下好几周的打字时间。

Emily Zhang
Emily Zhang
博士生

身为 PM,我在站会结束后直接口述会议摘要。走回座位时,润饰过的笔记已经贴在 Notion 里了。

David Park
David Park
产品经理

多语言支持太强了。我用三种语言口述翻译,Sumi 的语码转换完美无缝。

Léa Dubois
Léa Dubois
自由译者

通勤时用语音就把节目笔记写完了。以前要花一小时的事,现在十分钟搞定。

Ryan Torres
Ryan Torres
Podcast 主持人

每天回复 50 多封 email 以前让我精疲力竭。现在只要自然地说,Sumi 就给我专业又精炼的回复。

MT
Mika Tanaka
创业者

在 Figma 工作的同时用语音记录设计决策。情境感知润饰会自动帮我调整成适合 Wiki 的正式语气。

Priya Sharma
Priya Sharma
UX 设计师

以前不可能一边跑分析一边写报告。现在我边写代码边口述分析结果 — Sumi 帮我搞定后面的事。

James Wilson
James Wilson
数据科学家

多语言支持太强了。我用三种语言口述翻译,Sumi 的语码转换完美无缝。

Léa Dubois
Léa Dubois
自由译者

通勤时用语音就把节目笔记写完了。以前要花一小时的事,现在十分钟搞定。

Ryan Torres
Ryan Torres
Podcast 主持人

每天回复 50 多封 email 以前让我精疲力竭。现在只要自然地说,Sumi 就给我专业又精炼的回复。

MT
Mika Tanaka
创业者

在 Figma 工作的同时用语音记录设计决策。情境感知润饰会自动帮我调整成适合 Wiki 的正式语气。

Priya Sharma
Priya Sharma
UX 设计师

以前不可能一边跑分析一边写报告。现在我边写代码边口述分析结果 — Sumi 帮我搞定后面的事。

James Wilson
James Wilson
数据科学家

开源项目

核心功能免费使用。喜欢 Sumi?用行动支持我们。

核心功能

$0

以 GPLv3 开源。自由使用、自由查看、自由贡献。

无限次数本地端识别
支持 100+ 种语言
本地 + 云端 AI 润稿
情境感知自动调整语气
完全离线运作
社区讨论区支持
前往 GitHub

支持开源

每一个小动作,都是对开源社区最大的支持。

在 GitHub 给我们一颗 Star
提交 Pull Request 一起开发
反馈 Bug 让产品变更好
协助本地化翻译
分享给需要的朋友
到 GitHub 给我们一颗 Star ⭐

常见问题

关于 Sumi 你想知道的一切。

核心功能免费使用 — 本地转录、AI 润稿、情境感知、100+ 种语言。Sumi 以 GPLv3 开源,你随时可以查看和自行编译代码。

Sumi 可完全离线运行。语音识别使用设备上的 Whisper 搭配 Metal GPU 加速,AI 文字润饰可使用本地 LLM(Llama 3 / Qwen 2.5 / Qwen 3)。你的录音和文字永远不会离开你的设备,除非你主动选择使用自己的 API 密钥连接云端服务。

macOS:需要 macOS 13(Ventura)或更新版本,搭配 Apple Silicon(M1/M2/M3/M4)或至少 8 GB 内存的 Intel Mac。推荐使用 Apple Silicon 以获得 Metal GPU 加速。Windows:需要 Windows 10 或更新版本(x64)。CPU 版本适用于所有电脑;CUDA 版本需要支持 CUDA 的 NVIDIA 显卡,可获得更快的转录速度。

转录完成后,Sumi 会自动移除赘字(嗯、啊),修正语法,并根据你正在使用的 App 调整语气。你可以使用设备上的本地 LLM 进行润饰,也可以用自己的 API 密钥连接 OpenAI 或 Groq 等云端服务来获得更快的结果。

Sumi 适用于任何可以打字的应用程序 — Slack、Notion、VS Code、Gmail、Chrome、Safari、Discord 等数百款 App。它是一个系统级工具,会根据你正在使用的 App 甚至网址来自动调整情境感知 AI 润稿。

支持!Sumi 现已支持 Windows(x64,Windows 10 以上)。提供两个版本:CPU 版本适用于所有电脑,CUDA 版本可使用 NVIDIA GPU 加速获得更快的转录速度。Linux 版本尚未推出。

选中任何文字,按下 Ctrl+Option+Z,然后说出指令,例如「翻译成英文」或「语气更正式一点」。Sumi 的 AI 会直接改写选中的文字 — 不需要手动复制粘贴。

当然!Sumi 在 GitHub 上以 GPLv3 授权完全开源。我们欢迎任何形式的贡献 — 无论是代码、Bug 反馈、翻译或文档改善。欢迎到我们的 GitHub 项目页面开始参与。

准备好用说的了吗?

下载 Sumi,体验与思绪同步的打字速度。

GitHub 开源项目