FAQ
Schnelle Antworten auf die häufigsten Fragen.
Ist es wirklich kostenlos und ohne Wortlimit?
Ja. Keine Anmeldung, kein Zeichenlimit, keine Bezahlstufe. Füge einen Tweet ein oder einen ganzen Roman — gleiches Tool. Wir halten es kostenlos, indem wir Anzeigen schalten.
Ist Quick TTS DSGVO-konform?
Ja — und zwar by design. Die Sprachsynthese läuft komplett in deinem Browser: Web Speech ruft die OS-Stimme auf, Piper läuft als WebAssembly-Modul, Kokoro läuft per WebGPU. Wir verarbeiten keine personenbezogenen Daten im Sinne der DSGVO, weil dein Text das Gerät nie verlässt. Es gibt keine Server-Logs, weil keine Server-Anfrage stattfindet.
Damit eignet sich Quick TTS auch für vertrauliche Texte (Patientendaten, juristische Schriftsätze, interne Memos), bei denen klassische cloud-basierte TTS-Anbieter heikel wären — bei denen würde dein Text typischerweise an einen US-Server geschickt, was ohne DPA / SCCs als Datenübermittlung an einen Drittanbieter zu werten wäre. Die einzigen Drittanbieter-Cookies bei Quick TTS stammen von Google AdSense (über das Cookie-Banner anpassbar) und Google Analytics (DNT-respektierend). Volle Details im Datenschutzhinweis.
Welche deutschen Stimmen sind verfügbar?
Die Browser-TTS-Engine zeigt automatisch die deutschen Stimmen an, die in deinem Betriebssystem installiert sind. Was du siehst, hängt also vom Gerät ab:
- Windows 10/11: Microsoft Hedda, Stefan und Katja als klassische Stimmen. Über Edge zusätzlich die natürlicher klingenden Online-Varianten Katja Online, Conrad Online, Amala Online, Bernd Online und über zehn weitere.
- macOS und iOS: Siri-Stimmen Anna, Helena und Markus. Über Systemeinstellungen → Bedienungshilfen → Gesprochene Inhalte kannst du HD-Varianten nachladen.
- Chrome (Desktop): die Stimme „Google Deutsch“ — eine cloud-gestützte Stimme, die in den meisten Fällen besser klingt als die alten Windows-Stimmen.
- Android: Google-Stimmen, verwaltet in den Bedienungshilfen.
- Österreich und Schweiz: Microsoft Michael (de-AT), Karsten (de-CH); in Edge zusätzlich Ingrid, Jonas (Österreich), Leni und Jan (Schweiz) als Online-Stimmen.
Wenn dir alle System-Stimmen zu mechanisch klingen, schalte oben rechts die
Piper-Engine ein. Die deutschen Modelle de_DE-thorsten-medium
und de_DE-eva_k-x_low klingen deutlich natürlicher. Besonders interessant:
de_DE-thorsten_emotional-medium erlaubt Emotionsmarker im Text — ein Feature,
das keine andere kostenlose deutsche TTS-Seite anbietet. Kokoro HQ hat aktuell noch
keine deutsche Stimme.
Speichert ihr den Text, den ich einfüge?
Nein. Quick TTS läuft komplett clientseitig. Der Text, den du einfügst, wird von deinem Browser verarbeitet und nie an einen unserer Server geschickt. Wir haben keine Logs davon, weil er uns gar nicht erst erreicht.
Dein zuletzt eingefügter Text wird im localStorage deines Browsers gespeichert, damit er noch da ist, falls du den Tab versehentlich schließt — aber das passiert nur auf deinem Gerät. Über die Browser-Funktion „Website-Daten löschen" kannst du das wegwischen.
Was ist der Unterschied zwischen der Standardstimme und „AI Voice"?
Standard (Browser-TTS): das eingebaute Sprachmodul deines Browsers (Web Speech API). Sofort verfügbar, läuft auf jedem Gerät, klingt wie eine typische TTS-Stimme. Welche Stimmen es genau gibt, hängt vom Betriebssystem ab — Mac hat Samantha, Windows hat Zira und Natasha, Android und iOS haben jeweils eigene Sets.
AI Voice (nur Desktop) sind zwei neuronale Engines, die du dazuschalten kannst. Beide laufen nach einem einmaligen Download lokal auf deinem Gerät — dein Text verlässt den Browser nie.
- Piper — ~60MB Download, läuft per WebAssembly. Funktioniert in jedem Desktop-Browser. Klingt deutlich natürlicher als Browser-TTS.
- Kokoro HQ — höchste Qualität, ~80MB Download, läuft per WebGPU auf deiner GPU (Desktop-Chrome, Edge oder andere WebGPU-fähige Browser). Näher an einem echten Sprecher als an einem Roboter.
Schickt die KI-Stimme meinen Text an einen Server?
Nein. Sowohl Piper als auch Kokoro laufen komplett in deinem Browser — Piper über WebAssembly, Kokoro über WebGPU. Die einzigen Netzwerkanfragen sind der initiale Download von Bibliothek und Modell von jsDelivr und Hugging Face. Danach passiert die ganze Synthese von Text zu Audio auf deinem Gerät.
Funktioniert es auf dem Handy?
Auf dem Handy bekommst du Browser-TTS — es läuft überall mit den eingebauten Stimmen deines Handys. AI Voice (sowohl Piper als auch Kokoro HQ) ist aktuell Desktop-only: Piper-WASM lief im Test auf iOS schlecht (Audio-Glitches und lange Hänger), und Kokoro braucht WebGPU, das mobile GPUs noch nicht zuverlässig ausführen. Wir aktivieren AI Voice auf dem Handy wieder, sobald diese Probleme gelöst sind.
Darf ich das Audio kommerziell nutzen (YouTube, Podcasts, Produkte)?
Ja, mit einer Einschränkung: Du solltest das zugrundeliegende Stimmenmodell in den Credits oder der Beschreibung deines Projekts erwähnen.
- Browser-TTS: nutzt die eingebauten Stimmen deines Betriebssystems. Microsoft, Apple und Google haben jeweils eigene Bedingungen für die kommerzielle Nutzung von Systemstimmen — generell für gelegentliche und kleinere Nutzung erlaubt, bei großem Maßstab solltest du die Doku zur Zielstimme checken.
- Piper: die Engine steht unter MIT-Lizenz. Wir liefern eine kuratierte Auswahl an Stimmen: LibriTTS-R und VCTK sind CC-BY 4.0 (kommerzielle Nutzung mit Namensnennung erlaubt), Joe ist CC0 / Public Domain (keine Einschränkungen). Die Namensnennung für CC-BY-Stimmen reicht typischerweise als Zeile in der Video- oder Podcast-Beschreibung, etwa „Stimme von Piper TTS — LibriTTS-R / VCTK, CC-BY 4.0".
- Kokoro HQ: das Modell steht unter Apache 2.0 — kommerzielle Nutzung erlaubt. Apache 2.0 verlangt nicht zwingend Namensnennung, aber wir empfehlen, Kokoro-82M in den Projekt-Credits zu erwähnen.
Wir erheben keine Rechte an dem Audio, das du erzeugst. Du bist selbst dafür verantwortlich, die Lizenzen der zugrundeliegenden Modelle für deinen konkreten Anwendungsfall einzuhalten.
Wie lang darf mein Text sein?
So lang du willst. Wir zerlegen die Eingabe und streamen die Wiedergabe — ein Dokument mit 50.000 Wörtern funktioniert genauso wie ein einzelner Satz, dauert nur länger. Bei AI Voice laufen Generierung und Wiedergabe parallel, damit du vorne nicht lange warten musst.
Warum dauert die erste AI-Voice-Wiedergabe so lang?
Beim ersten Wechsel auf eine AI-Engine muss dein Browser das Modell herunterladen — ~60MB für Piper, ~80MB für Kokoro HQ. Das dauert je nach Verbindung ein paar Sekunden bis eine Minute. Danach ist es im Browser gecacht, und alle weiteren Aufrufe sind schnell.
Ich bin am Arbeitsrechner und AI Voice hängt bei „Downloading..."
Manche Firmennetze blockieren jsDelivr oder Hugging Face — das sind die CDNs, die Piper und Kokoro hosten. Wenn keine der beiden AI-Engines fertig initialisiert wird, ist das fast immer die Ursache. Browser-TTS funktioniert ohne externe Downloads, also ein guter Fallback in geschlossenen Umgebungen.
Warum sehe ich Anzeigen?
Mit Anzeigen bezahlen wir die Domain, das Hosting und die Zeit, das Tool zu pflegen. Das ist der Deal, damit es kostenlos und ohne Limits bleibt. Wenn du Werbung hasst — Respekt, und ein Adblocker im Browser ist deine Option. Wir machen dir dafür kein schlechtes Gewissen.
Werden meine Tastatureingaben getrackt?
Nein. Wir betreiben kein Analytics auf Tastenebene und kein Keystroke-Logging. Details stehen in der Datenschutzerklärung.
Etwas ist kaputt / ich habe Feedback
Schreib eine Mail an hello@quick-tts.com. Bitte mit Browser und Betriebssystem.