语音转录
按住快捷键开始录音即可看到实时预览;支持 HTTP STT,也支持 Coli 本地流式语音转录,松开后继续 AI 优化与注入。
面向 macOS 的 AI 输入助手,把语音转录、AI 润色、智能回复、朗读与 OCR 融合进同一套顺滑工作流。
你是“语言大师”发言润色助手,只对当前输入做最小必要优化。
保留原意,语气更凝练,适合管理沟通与任务安排。
表达更清晰礼貌,适合汇报、确认和协作回复。
把获取内容、处理文本与输出结果收进一条更连贯的链路里,减少切换。
把高频输入场景需要的能力整合到一个统一入口。
按住快捷键开始录音即可看到实时预览;支持 HTTP STT,也支持 Coli 本地流式语音转录,松开后继续 AI 优化与注入。
把口语表达整理成更自然、更准确、更适合聊天或邮件场景的文本。
多角色并发输出,适合翻译、润色、不同语气回复和多版本快速对比。
支持选中文本朗读、回复结果发音与音色配置,适合语言练习与内容校对。
快速框选屏幕区域提取文字;现支持文字识别与二维码识别模式切换,网页、图片、PDF、登录码和群二维码都能继续进入处理流程。
支持 OpenAI Compatible HTTP 接入,也支持 Coli 本地 CLI 语音转录,兼顾云端服务与本地实时识别。
快速浏览主要配置页面与新增能力。
从唤起到输出,流程清晰直接。
通过菜单栏或快捷键进入录音、回复、发音或 OCR。
接收语音、当前选中文本,或截图识别出来的文字。
根据角色、提示词与服务配置生成更适合当前场景的结果。
注入当前输入框,或继续朗读、复制、比对,减少来回切换。
覆盖聊天、写作、翻译与截图取字等常见场景。
适合微信、飞书、Slack、IM 回复,先说再发,减少打字停顿。
先口述,再通过 AI 整理成更正式、更清晰的书面表达。
一键得到中英互译和多种风格版本,回复更快,也更稳。
从图片、网页、PDF 提取文本,也能直接识别二维码内容,再继续优化、朗读或复制使用。
VoiceIME-v2.5.4-macOS.zip 内同时包含 install.sh 与 VoiceIME.dmg,但站点仅提供 ZIP 下载入口。
适合想最快开始使用的用户。
./install.sh下载并解压 VoiceIME-v2.5.4-macOS.zip./install.sh按提示完成授权适合偏好原生拖拽安装的用户。
VoiceIME.dmgOpen AnywayVoiceIME.dmg 并拖入 Applications如果遇到系统拦截,允许 Open Anyway 后即可继续。
站点仅提供 ZIP 安装包下载,解压后即可选择 CLI 或 DMG 安装。
直接下载 VoiceIME-v2.5.4-macOS.zip,解压后可运行 ./install.sh,或打开 ZIP 内的 VoiceIME.dmg 安装。
这里整理了首次安装与使用时最常见的问题。
新增 Coli 本地语音转录、录音阶段流式预览、回复角色预览,并同步更新 ZIP / DMG 双安装方式说明。
适合聊天沟通、邮件撰写、文档整理、翻译回复,以及截图取字后的继续编辑。
这些权限分别用于录音、文本注入、快捷键监听和截图 OCR / 二维码识别,是完成整条输入链路所必需的系统能力。
可按需使用 ChatGPT OAuth,或接入兼容 OpenAI 协议的第三方 API。
完成授权后,即可通过菜单栏或快捷键使用录音、智能回复、智能发音与截图 OCR。
建议优先下载 ZIP 安装包:可执行 ./install.sh,或打开其中的 DMG。若首次启动被拦截,在“隐私与安全性”里点击 Open Anyway 即可。