À propos
Quick TTS existe parce que tous les autres outils gratuits de synthèse vocale soit vous limitent à 1 000 mots, soit vous obligent à créer un compte, soit essaient de vous pousser vers un abonnement. Pas celui-ci.
Ce que c'est
Quick TTS est une application web monopage qui prend le texte que vous collez et le lit à voix haute dans votre navigateur. Pas de compte. Pas de limite de caractères. Pas de filigrane. Pas de « passez à la version supérieure pour continuer ». Juste un champ de texte, un bouton lecture et une voix.
Sous le capot, deux moteurs vocaux cohabitent :
- La voix intégrée à votre navigateur (l'API Web Speech), qui fonctionne partout : ordinateur, mobile, et même, à défaut, sur les anciens systèmes.
- AI Voice, un modèle TTS neuronal optionnel appelé Kokoro qui tourne sur votre GPU via WebGPU pour une lecture nettement plus naturelle. Pour l'instant, uniquement sur Chrome et Edge en version desktop.
Pourquoi c'est gratuit
Faire tourner le site coûte à peu près le prix d'un café par mois (hébergement statique sur Firebase, un nom de domaine, et c'est tout). Les annonces Google AdSense couvrent ce coût et — si ça décolle — finiront par couvrir une partie du temps que nous y consacrons.
Aucun palier payant n'est prévu. Pas de « voix premium » derrière un paywall. La fonction AI Voice est gratuite pour la même raison que la version par défaut l'est : elle tourne sur votre machine, pas sur la nôtre, donc nous la proposer ne nous coûte rien.
Principes de conception
Quelques règles que nous essayons de tenir :
- Votre texte reste sur votre appareil. Toute la synthèse se fait côté client. Nous ne recevons jamais votre texte, et nous ne le recevrons jamais.
- Pas d'inscription. Le moment où un outil exige un compte pour une interaction de 30 secondes, il a échoué.
- Pas de dark patterns. Les annonces sont des bannières dans des emplacements fixes. Pas de pop-unders, pas d'interstitiels, pas de « patientez 15 secondes avant l'écoute », pas de faux boutons de téléchargement.
- Transparent sur les limites. La seule chose qui ne peut pas être synthétisée, c'est un texte trop long pour la mémoire de votre navigateur. Si quelque chose ne fonctionne pas, l'explication est dans la FAQ.
Construit sur des technos ouvertes
Quick TTS n'existerait pas sans quelques pièces brillantes du logiciel libre :
- Kokoro-82M — le modèle TTS neuronal qui alimente l'option Kokoro HQ (Apache 2.0).
- Piper de rhasspy — le moteur TTS neuronal universel qui alimente l'option Piper (MIT). Voix issues de rhasspy/piper-voices : nous embarquons un ensemble sélectionné sous CC-BY 4.0 (LibriTTS-R, VCTK) et CC0 / domaine public (Joe). Les détails de licence figurent dans la MODEL_CARD de chaque voix sur le dépôt piper-voices.
- Transformers.js — la bibliothèque qui permet d'exécuter des modèles ML dans le navigateur.
- vits-web — les bindings WASM pour les modèles de la famille VITS qui font tourner Piper dans les navigateurs.
- L'API Web Speech — embarquée discrètement dans les navigateurs depuis plus d'une décennie, le travailleur de l'ombre dont personne ne parle.
Qui est derrière
Quick TTS a été conçu par une petite équipe de Next Now Agency comme projet jumeau de WSBSynth, un lecteur de commentaires r/wallstreetbets en temps réel. La majeure partie de l'architecture TTS est partagée entre les deux : WSBSynth a servi de banc d'essai, Quick TTS en est la version grand public.
Contact
Bugs, retours, demandes de fonctionnalités, presse : hello@quick-tts.com. Ou consultez la page de contact pour en savoir plus.