FAQ
Szybkie odpowiedzi na najczęstsze pytania.
Czy to naprawdę za darmo i bez limitu słów?
Tak. Bez rejestracji, bez limitu znaków, bez płatnej wersji. Wklej tweet albo wklej powieść — to samo narzędzie. Utrzymujemy je za darmo dzięki reklamom.
Czy zapisujecie tekst, który wklejam?
Nie. Quick TTS działa w całości po stronie klienta. Tekst, który wklejasz, jest przetwarzany przez twoją przeglądarkę i nigdy nie trafia na nasze serwery. Nie mamy z niego logów, bo do nas nie dociera.
Twój ostatni wklejony tekst jest zapisywany w localStorage przeglądarki, żeby był na miejscu, gdy przypadkiem zamkniesz kartę, ale to siedzi tylko na twoim urządzeniu. Wyczyść dane witryny, żeby się go pozbyć.
Jaka jest różnica między domyślnym głosem a „AI Voice"?
Domyślny (Browser TTS): wbudowany silnik mowy przeglądarki (Web Speech API). Dostępny od razu, działa na każdym urządzeniu i brzmi jak typowy głos TTS. Konkretne dostępne głosy zależą od systemu — Mac ma Samanthę, Windows ma Zirę i Natashę, Android i iOS mają własne zestawy.
AI Voice (tylko desktop) to dwa neuronowe silniki, które możesz włączyć. Oba działają lokalnie na twoim urządzeniu po jednorazowym pobraniu — twój tekst nigdy nie opuszcza przeglądarki.
- Piper — ~60MB do pobrania, działa w WebAssembly. Działa w każdej desktopowej przeglądarce. Brzmi znacznie naturalniej niż Browser TTS.
- Kokoro HQ — najwyższa jakość, ~80MB do pobrania, działa na twoim GPU przez WebGPU (desktopowy Chrome, Edge lub inne przeglądarki ze wsparciem WebGPU). Bliżej prawdziwego lektora niż robota.
Czy głos AI wysyła mój tekst na serwer?
Nie. Zarówno Piper, jak i Kokoro działają w całości w twojej przeglądarce — Piper przez WebAssembly, Kokoro przez WebGPU. Jedyne zapytania sieciowe to wstępne pobrania biblioteki i modelu z jsDelivr i Hugging Face. Potem cała synteza tekstu na audio dzieje się na twoim urządzeniu.
Czy działa na telefonie?
Na telefonie dostajesz Browser TTS — działa wszędzie i używa wbudowanych głosów twojego telefonu. AI Voice (zarówno Piper, jak i Kokoro HQ) jest na razie tylko na desktop: Piper-WASM słabo działał na iOS w testach (zacinanie dźwięku i długie zwisy), a Kokoro wymaga WebGPU, którego mobilne GPU jeszcze nie odpalają stabilnie. Włączymy AI Voice na mobilnych z powrotem, gdy te problemy się rozwiążą.
Czy mogę używać audio komercyjnie (YouTube, podcasty, produkty)?
Tak, z jednym zastrzeżeniem: warto wymienić użyty model głosu w napisach albo opisie projektu.
- Browser TTS: używa wbudowanych głosów twojego systemu. Microsoft, Apple i Google publikują własne warunki komercyjnego użycia głosów systemowych — ogólnie dopuszczalne dla incydentalnego i drobnego użytku, ale sprawdź dokumentację dla docelowego głosu, jeśli skalujesz.
- Piper: silnik na licencji MIT. Dostarczamy wybrany zestaw głosów: LibriTTS-R i VCTK na CC-BY 4.0 (komercyjne OK z atrybucją), Joe na CC0 / domena publiczna (bez ograniczeń). Atrybucję dla głosów CC-BY zwykle załatwia linijka w opisie wideo lub podcastu, np. „Głos: Piper TTS — LibriTTS-R / VCTK, CC-BY 4.0".
- Kokoro HQ: model na licencji Apache 2.0 — komercyjne użycie dozwolone. Apache 2.0 nie wymaga ścisłej atrybucji, ale w dobrym tonie jest wymienić Kokoro-82M w napisach projektu.
Nie roszczymy sobie praw do audio, które generujesz. To ty odpowiadasz za zgodność z licencjami modeli źródłowych w swoim konkretnym przypadku.
Jak długi może być mój tekst?
Tak długi, jak chcesz. Dzielimy wejście na kawałki i strumieniujemy odtwarzanie, więc wklejenie dokumentu na 50 000 słów działa tak samo jak zdania — po prostu trwa dłużej. W trybie AI Voice generujemy równolegle z odtwarzaniem, żeby nie czekać długo na początek.
Dlaczego pierwsze odtworzenie AI Voice tak długo startuje?
Przy pierwszym przełączeniu na silnik AI przeglądarka musi pobrać model — ~60MB dla Pipera, ~80MB dla Kokoro HQ. Zajmuje to kilka sekund do minuty, zależnie od łącza. Potem siedzi w cache przeglądarki i kolejne użycia są szybkie.
Jestem na komputerze służbowym i AI Voice utknął na „Downloading..."
Niektóre sieci firmowe blokują jsDelivr lub Hugging Face — to CDN-y, które hostują Pipera i Kokoro. Jeśli żaden z silników AI nie kończy inicjalizacji, to prawie zawsze tego rodzaju powód. Browser TTS działa bez żadnych zewnętrznych pobrań, więc to dobre wyjście awaryjne w zamkniętych środowiskach.
Dlaczego widzę reklamy?
Reklamy płacą za domenę, hosting i czas na utrzymanie narzędzia. To umowa, dzięki której zostaje za darmo i bez limitów. Jak nie znosisz reklam, masz nasz szacunek — i adblockera w przeglądarce — do dyspozycji. Nie będziemy ci wyrzutów robić.
Czy moje wciśnięcia klawiszy są śledzone?
Nie. Nie zbieramy analityki klawiszy ani keystroke loggingu. Pełen opis w Polityce prywatności.
Coś się zepsuło / mam uwagi
Napisz na hello@quick-tts.com. Podaj przeglądarkę i system.