О проекте
Quick TTS существует потому, что любой другой бесплатный сервис озвучки текста либо обрезает на 1000 слов, либо требует регистрацию, либо втюхивает подписку. У нас не так.
Что это
Quick TTS — одностраничное веб-приложение, которое берёт любой вставленный текст и читает его вслух прямо в браузере. Без аккаунта. Без лимита на символы. Без водяных знаков. Без «обновитесь, чтобы продолжить». Только поле ввода, кнопка play и голос.
Под капотом два движка речи:
- Встроенный голос браузера (Web Speech API), работает везде — на десктопе, на мобильных, в крайнем случае даже на старых системах.
- AI Voice — опциональная нейронная TTS-модель Kokoro, которая работает на твоём GPU через WebGPU и звучит заметно естественнее. Пока только Chrome/Edge на десктопе.
Почему бесплатно
Содержание сайта обходится примерно в стоимость одного кофе в месяц (статический хостинг на Firebase, регистрация домена, и всё). Display-реклама от Google AdSense покрывает эти расходы, а если проект пойдёт — со временем и часть времени, что уходит на разработку и поддержку.
Платного тарифа не планируем. Никакого «премиум-голоса» за paywall нет. Функция AI Voice бесплатная по той же причине, что и стандартный режим: она работает на твоей машине, а не на нашей, поэтому ничего нам не стоит.
Принципы
Несколько правил, которых стараемся держаться:
- Твой текст остаётся на твоём устройстве. Весь синтез идёт на клиенте. Мы никогда не получаем твой текст и никогда не получим.
- Без регистрации. В тот момент, когда сервис требует аккаунт ради 30-секундного действия, он провалился.
- Без тёмных паттернов. Реклама — display-баннеры в фиксированных слотах. Никаких pop-under, межстраничных баннеров, «подождите 15 секунд перед воспроизведением», фейковых кнопок «скачать».
- Прозрачные ограничения. Единственное, что не получится озвучить — текст слишком длинный, чтобы браузер удержал его в памяти. Если что-то не работает, причина есть в FAQ.
Построено на открытых технологиях
Quick TTS не существовал бы без нескольких отличных open-source-проектов:
- Kokoro-82M — нейронная TTS-модель, на которой работает опция Kokoro HQ (Apache 2.0).
- Piper от rhasspy — универсальный нейронный TTS, на котором работает опция Piper (MIT). Голосовые модели из rhasspy/piper-voices: мы поставляем кураторский набор под CC-BY 4.0 (LibriTTS-R, VCTK) и CC0 / public domain (Joe). Лицензии описаны в MODEL_CARD каждого голоса в репозитории piper-voices.
- Transformers.js — библиотека, благодаря которой ML-модели запускаются в браузере.
- vits-web — WASM-биндинги для моделей семейства VITS, благодаря которым Piper работает в браузере.
- Web Speech API — больше десяти лет тихо живёт в браузерах и до сих пор остаётся незаметной рабочей лошадкой.
Кто это сделал
Quick TTS собрала небольшая команда из Next Now Agency как побочный проект к WSBSynth — читалке комментариев из r/wallstreetbets в реальном времени. Большая часть TTS-архитектуры общая — WSBSynth был полигоном, Quick TTS — версия, удобная для конечного пользователя.
Контакты
Баги, фидбек, идеи фич, пресса: hello@quick-tts.com. Или загляни на страницу контактов.