关于

Quick TTS 存在的理由很简单：其他几乎所有免费文字转语音工具，要么把你限制在 1000 个单词以内，要么强制注册，要么想方设法让你订阅付费版。这里都没有。

这是什么

Quick TTS 是一个单页 Web 应用，把你粘贴的任意文字直接在浏览器里读出来。不用账号，不限字数，没有水印，也没有"升级才能继续"。只有一个文本框、一个播放按钮和一个声音。

底层有两套语音引擎：

浏览器内置语音（Web Speech API）：在桌面、移动设备甚至较老的系统上都能用。
AI Voice：可选的神经网络 TTS 模型 Kokoro，通过 WebGPU 在你的 GPU 上运行，朗读效果自然得多。目前仅支持桌面版 Chrome / Edge。

网站的运行成本大概是每月一杯咖啡的钱（Firebase 静态托管加上一个域名，没别的）。 Google AdSense 的展示广告刚好覆盖这部分开销 —— 如果将来用的人多了，还能补贴一些开发和维护的时间。

没有付费层级的计划。没有藏在付费墙后的"高级语音"。AI Voice 之所以免费，和默认功能免费是同一个原因：它在你的设备上运行，不在我们的服务器上跑，所以提供它对我们没有额外成本。

我们尽量遵守这几条规则：

没有这几个出色的开源项目,Quick TTS 不可能存在:

Kokoro-82M —— 驱动 Kokoro HQ 选项的神经 TTS 模型(Apache 2.0)。
Piper(rhasspy 出品) —— 驱动 Piper 选项的通用神经 TTS(MIT)。语音模型来自 rhasspy/piper-voices:我们打包了一组精选语音,采用 CC-BY 4.0 (LibriTTS-R、VCTK)和 CC0 / 公有领域(Joe)。授权细节见 piper-voices 仓库中每个语音的 MODEL_CARD。
Transformers.js —— 让 ML 模型在浏览器中运行的库。
vits-web —— 让 Piper 在浏览器中运行的 VITS 系列模型 WASM 绑定。
Web Speech API —— 在浏览器里默默服役了十多年,至今仍是被低估的主力。

Quick TTS 由 Next Now Agency 的小团队制作,是 WSBSynth (一个实时朗读 r/wallstreetbets 评论的项目)的姊妹项目。两者共用大部分 TTS 架构 —— WSBSynth 是试验场,Quick TTS 是面向普通用户的版本。

Bug、反馈、功能请求、媒体采访:hello@quick-tts.com。或查看联系页面了解更多。