← Назад в Quick TTS

О проекте

Quick TTS существует потому, что любой другой бесплатный сервис озвучки текста либо обрезает на 1000 слов, либо требует регистрацию, либо втюхивает подписку. У нас не так.

Что это

Quick TTS — одностраничное веб-приложение, которое берёт любой вставленный текст и читает его вслух прямо в браузере. Без аккаунта. Без лимита на символы. Без водяных знаков. Без «обновитесь, чтобы продолжить». Только поле ввода, кнопка play и голос.

Под капотом два движка речи:

Встроенный голос браузера (Web Speech API), работает везде — на десктопе, на мобильных, в крайнем случае даже на старых системах.
AI Voice — опциональная нейронная TTS-модель Kokoro, которая работает на твоём GPU через WebGPU и звучит заметно естественнее. Пока только Chrome/Edge на десктопе.

Почему бесплатно

Содержание сайта обходится примерно в стоимость одного кофе в месяц (статический хостинг на Firebase, регистрация домена, и всё). Display-реклама от Google AdSense покрывает эти расходы, а если проект пойдёт — со временем и часть времени, что уходит на разработку и поддержку.

Платного тарифа не планируем. Никакого «премиум-голоса» за paywall нет. Функция AI Voice бесплатная по той же причине, что и стандартный режим: она работает на твоей машине, а не на нашей, поэтому ничего нам не стоит.

Принципы

Несколько правил, которых стараемся держаться:

Твой текст остаётся на твоём устройстве. Весь синтез идёт на клиенте. Мы никогда не получаем твой текст и никогда не получим.
Без регистрации. В тот момент, когда сервис требует аккаунт ради 30-секундного действия, он провалился.
Без тёмных паттернов. Реклама — display-баннеры в фиксированных слотах. Никаких pop-under, межстраничных баннеров, «подождите 15 секунд перед воспроизведением», фейковых кнопок «скачать».
Прозрачные ограничения. Единственное, что не получится озвучить — текст слишком длинный, чтобы браузер удержал его в памяти. Если что-то не работает, причина есть в FAQ.

Построено на открытых технологиях

Quick TTS не существовал бы без нескольких отличных open-source-проектов:

Kokoro-82M — нейронная TTS-модель, на которой работает опция Kokoro HQ (Apache 2.0).
Piper от rhasspy — универсальный нейронный TTS, на котором работает опция Piper (MIT). Голосовые модели из rhasspy/piper-voices: мы поставляем кураторский набор под CC-BY 4.0 (LibriTTS-R, VCTK) и CC0 / public domain (Joe). Лицензии описаны в MODEL_CARD каждого голоса в репозитории piper-voices.
Transformers.js — библиотека, благодаря которой ML-модели запускаются в браузере.
vits-web — WASM-биндинги для моделей семейства VITS, благодаря которым Piper работает в браузере.
Web Speech API — больше десяти лет тихо живёт в браузерах и до сих пор остаётся незаметной рабочей лошадкой.

Кто это сделал

Quick TTS собрала небольшая команда из Next Now Agency как побочный проект к WSBSynth — читалке комментариев из r/wallstreetbets в реальном времени. Большая часть TTS-архитектуры общая — WSBSynth был полигоном, Quick TTS — версия, удобная для конечного пользователя.

Контакты

Баги, фидбек, идеи фич, пресса: hello@quick-tts.com. Или загляни на страницу контактов.