关于
Quick TTS 存在的理由很简单:其他几乎所有免费文字转语音工具,要么把你限制在 1000 个单词以内,要么强制注册,要么想方设法让你订阅付费版。这里都没有。
这是什么
Quick TTS 是一个单页 Web 应用,把你粘贴的任意文字直接在浏览器里读出来。 不用账号,不限字数,没有水印,也没有"升级才能继续"。 只有一个文本框、一个播放按钮和一个声音。
底层有两套语音引擎:
- 浏览器内置语音(Web Speech API):在桌面、移动设备甚至较老的系统上都能用。
- AI Voice:可选的神经网络 TTS 模型 Kokoro,通过 WebGPU 在你的 GPU 上运行, 朗读效果自然得多。目前仅支持桌面版 Chrome / Edge。
为什么是免费的
网站的运行成本大概是每月一杯咖啡的钱(Firebase 静态托管加上一个域名,没别的)。 Google AdSense 的展示广告刚好覆盖这部分开销 —— 如果将来用的人多了, 还能补贴一些开发和维护的时间。
没有付费层级的计划。没有藏在付费墙后的"高级语音"。AI Voice 之所以免费, 和默认功能免费是同一个原因:它在你的设备上运行,不在我们的服务器上跑, 所以提供它对我们没有额外成本。
设计原则
我们尽量遵守这几条规则:
- 你的文字留在你的设备上。所有合成都在客户端完成。 我们从来收不到你的文字,以后也不会。
- 无需注册。一个 30 秒就能用完的小工具,如果还要求开账号,那它已经失败了。
- 没有套路。广告就是固定位置的展示广告。没有弹出层、 没有插页广告、没有"等 15 秒才能播放"、没有假下载按钮。
- 限制写得明明白白。唯一无法合成的,是长到浏览器内存放不下的文本。 如果哪里不工作,理由都在 FAQ 里。
基于开源技术
没有这几个出色的开源项目,Quick TTS 不可能存在:
- Kokoro-82M —— 驱动 Kokoro HQ 选项的神经 TTS 模型(Apache 2.0)。
- Piper(rhasspy 出品) —— 驱动 Piper 选项的通用神经 TTS(MIT)。语音模型来自 rhasspy/piper-voices:我们打包了一组精选语音,采用 CC-BY 4.0 (LibriTTS-R、VCTK)和 CC0 / 公有领域(Joe)。授权细节见 piper-voices 仓库中每个语音的 MODEL_CARD。
- Transformers.js —— 让 ML 模型在浏览器中运行的库。
- vits-web —— 让 Piper 在浏览器中运行的 VITS 系列模型 WASM 绑定。
- Web Speech API —— 在浏览器里默默服役了十多年,至今仍是被低估的主力。
谁做的
Quick TTS 由 Next Now Agency 的小团队制作,是 WSBSynth (一个实时朗读 r/wallstreetbets 评论的项目)的姊妹项目。两者共用大部分 TTS 架构 —— WSBSynth 是试验场,Quick TTS 是面向普通用户的版本。
联系
Bug、反馈、功能请求、媒体采访:hello@quick-tts.com。 或查看联系页面了解更多。