macOS · Menu Bar · AI Input Assistant

让输入更快,
也更高级。

面向 macOS 的 AI 输入助手,把语音转录、AI 润色、智能回复、朗读与 OCR 融合进同一套顺滑工作流。

适用于 macOS 全局快捷键 智能回复 Coli 流式语音转录
下载后即可安装 支持 Coli 本地流式转录

多角色并发生成,快速切到合适语气

语言大师

你是“语言大师”发言润色助手,只对当前输入做最小必要优化。

已启用
老板

保留原意,语气更凝练,适合管理沟通与任务安排。

待启用
员工

表达更清晰礼貌,适合汇报、确认和协作回复。

待启用
单选激活 拖拽排序 快速编辑
回复角色
老板

收到,登录已完成,后续按流程继续推进即可。

员工

好的,已登录成功,我这边继续下一步操作。

快捷入口
⌘⇧O开始录音
⌃⇧U智能回复
⌘⇧I智能发音
⌘⇧P截图 OCR
5 核心能力 / 工具入口
Menu Bar 常驻系统级工作流
AI + OCR 输入链路一体化
HTTP + CLI 支持灵活接入
更像一个输入层,而不是单点工具

VoiceIME 不只把声音转成字,而是把“输入前后的动作”一起接住。

把获取内容、处理文本与输出结果收进一条更连贯的链路里,减少切换。

核心能力

核心功能

把高频输入场景需要的能力整合到一个统一入口。

AI Polish

AI 优化

把口语表达整理成更自然、更准确、更适合聊天或邮件场景的文本。

Smart Reply

智能回复

多角色并发输出,适合翻译、润色、不同语气回复和多版本快速对比。

Pronunciation

智能发音

支持选中文本朗读、回复结果发音与音色配置,适合语言练习与内容校对。

Screen OCR

截图 OCR

快速框选屏幕区域提取文字;现支持文字识别与二维码识别模式切换,网页、图片、PDF、登录码和群二维码都能继续进入处理流程。

Flexible Access

灵活接入

支持 OpenAI Compatible HTTP 接入,也支持 Coli 本地 CLI 语音转录,兼顾云端服务与本地实时识别。

界面预览

界面预览

快速浏览主要配置页面与新增能力。

使用流程

四步完成一次更顺手的输入

从唤起到输出,流程清晰直接。

01

唤起功能

通过菜单栏或快捷键进入录音、回复、发音或 OCR。

02

获取内容

接收语音、当前选中文本,或截图识别出来的文字。

03

AI 处理

根据角色、提示词与服务配置生成更适合当前场景的结果。

04

直接输出

注入当前输入框,或继续朗读、复制、比对,减少来回切换。

适用场景

适合这些高频输入场景

覆盖聊天、写作、翻译与截图取字等常见场景。

聊天沟通

适合微信、飞书、Slack、IM 回复,先说再发,减少打字停顿。

邮件与文档

先口述,再通过 AI 整理成更正式、更清晰的书面表达。

双语翻译

一键得到中英互译和多种风格版本,回复更快,也更稳。

截图取字

从图片、网页、PDF 提取文本,也能直接识别二维码内容,再继续优化、朗读或复制使用。

快速安装

几分钟内开始使用 VoiceIME。

VoiceIME-v2.5.4-macOS.zip 内同时包含 install.shVoiceIME.dmg,但站点仅提供 ZIP 下载入口。

Terminal UI

CLI 快速安装

适合想最快开始使用的用户。

  • 下载并解压 ZIP
  • 运行 ./install.sh
  • 按提示完成授权
Terminal UI
1.下载并解压 VoiceIME-v2.5.4-macOS.zip
2../install.sh
3.按提示完成授权
DMG 安装

DMG 图形安装

适合偏好原生拖拽安装的用户。

  • 打开 VoiceIME.dmg
  • 拖入 Applications
  • 如遇拦截,点击 Open Anyway
  1. 打开 VoiceIME.dmg 并拖入 Applications
  2. 首次启动如被拦截,前往 系统设置 → 隐私与安全性
  3. 点击 Open Anyway 后再次打开应用

如果遇到系统拦截,允许 Open Anyway 后即可继续。

下载体验

准备好开始体验 VoiceIME 了吗?

站点仅提供 ZIP 安装包下载,解压后即可选择 CLI 或 DMG 安装。

ZIP 安装包 内含 install.sh + DMG 包含最新 2.5.4
下载 VoiceIME v2.5.4 ZIP

直接下载 VoiceIME-v2.5.4-macOS.zip,解压后可运行 ./install.sh,或打开 ZIP 内的 VoiceIME.dmg 安装。

常见问题

常见问题

这里整理了首次安装与使用时最常见的问题。

v2.5.4 更新

新增 Coli 本地语音转录、录音阶段流式预览、回复角色预览,并同步更新 ZIP / DMG 双安装方式说明。

适合聊天沟通、邮件撰写、文档整理、翻译回复,以及截图取字后的继续编辑。

这些权限分别用于录音、文本注入、快捷键监听和截图 OCR / 二维码识别,是完成整条输入链路所必需的系统能力。

可按需使用 ChatGPT OAuth,或接入兼容 OpenAI 协议的第三方 API。

完成授权后,即可通过菜单栏或快捷键使用录音、智能回复、智能发音与截图 OCR。

建议优先下载 ZIP 安装包:可执行 ./install.sh,或打开其中的 DMG。若首次启动被拦截,在“隐私与安全性”里点击 Open Anyway 即可。