Quick TTS について
Quick TTS が存在するのは、ほかのほぼすべての無料テキスト読み上げツールが 1,000 単語で打ち切る、登録を求める、サブスクへの誘導をしてくる、のいずれかだからです。ここはそうではありません。
このツールの概要
Quick TTS は、貼り付けたテキストをそのままブラウザで読み上げる シングルページの Web アプリです。アカウント不要。文字数制限なし。 ウォーターマークなし。「続きはアップグレード」もなし。 あるのはテキストボックスと再生ボタン、そして声だけです。
内部には 2 つの音声エンジンがあります:
- ブラウザ内蔵の音声(Web Speech API)。デスクトップでも モバイルでも、古めの環境でもひととおり動作します。
- AI Voice。Kokoro というニューラル TTS モデルを WebGPU で GPU 上で動かすオプションで、はるかに自然な読み上げになります。 現時点ではデスクトップ版 Chrome / Edge のみ対応。
無料である理由
このサイトの運営費は月にコーヒー一杯分ほどです(Firebase の静的ホスティングと ドメイン代だけ)。Google AdSense のディスプレイ広告でその費用と、 軌道に乗れば開発・運用にかかる時間の一部もまかなえる計算です。
有料プランの予定はありません。「プレミアム音声」を有料の壁の向こうに 隠すこともしません。AI Voice 機能が無料なのは、デフォルトが無料なのと 同じ理由です — お使いのマシンで動くので、こちらに費用がかからないからです。
設計の方針
守ろうとしているルールがいくつかあります:
- テキストはあなたの端末から出ません。 合成はすべてクライアント側で行います。あなたのテキストを 受け取ることはありませんし、これからもありません。
- 登録不要。30 秒のやりとりのためにアカウントを要求してくる ツールは、その時点で失格です。
- ダークパターンなし。広告は固定枠のディスプレイ広告のみ。 ポップアンダー、インタースティシャル、「音声再生まで 15 秒お待ちください」、 偽のダウンロードボタン — 一切ありません。
- 制限について率直に。合成できないのは、 ブラウザのメモリに収まらないほど長すぎるテキストだけです。 うまく動かないときの理由はFAQに書いてあります。
オープンな技術がベース
Quick TTS は素晴らしいオープンソースの成果なしには成り立ちません:
- Kokoro-82M — Kokoro HQ オプションを支えるニューラル TTS モデル(Apache 2.0)。
- Piper(rhasspy 作) — Piper オプションを支える汎用ニューラル TTS(MIT)。rhasspy/piper-voices から厳選した音声を同梱。CC-BY 4.0(LibriTTS-R、VCTK)と CC0 / パブリックドメイン(Joe)。ライセンスの詳細は piper-voices リポジトリ内の各音声の MODEL_CARD を参照。
- Transformers.js — ML モデルをブラウザで動かすためのライブラリ。
- vits-web — Piper をブラウザで動かすための VITS 系モデル用 WASM バインディング。
- Web Speech API — 10 年以上前から静かにブラウザに搭載されている、地味だが頼れる存在。
制作者
Quick TTS は Next Now Agency の小さなチームが、 WSBSynth (r/wallstreetbets のコメントをリアルタイムで読み上げるサービス)の 姉妹プロジェクトとして作りました。TTS アーキテクチャの大部分は 両者で共有しています — WSBSynth が試験場で、Quick TTS は 一般ユーザー向けの仕上がり版です。
お問い合わせ
バグ報告、フィードバック、機能要望、取材:hello@quick-tts.com。 詳しくはお問い合わせページへ。