Hakkında
Quick TTS var, çünkü diğer her ücretsiz metinden sese aracı ya sizi 1.000 kelimede durduruyor, ya kayıt olmaya zorluyor ya da abonelik satmaya çalışıyor. Bu öyle değil.
Bu nedir
Quick TTS, yapıştırdığınız metni tarayıcınızda yüksek sesle okuyan tek sayfalık bir web uygulamasıdır. Hesap yok. Karakter sınırı yok. Filigran yok. "Devam etmek için yükseltin" yok. Sadece bir metin kutusu, bir oynat düğmesi ve bir ses.
Arka planda iki konuşma motoru çalışıyor:
- Tarayıcınızın yerleşik sesi (Web Speech API); her yerde çalışır — masaüstü, mobil, hatta gerektiğinde eski sistemler.
- AI Voice; Kokoro adlı, isteğe bağlı bir nöral TTS modeli. Çok daha doğal bir okuma için WebGPU üzerinden GPU'nuzda çalışır. Şimdilik yalnızca masaüstü Chrome/Edge.
Neden ücretsiz
Siteyi ayakta tutmak ayda yaklaşık bir kahve fiyatına mal oluyor (Firebase'de statik barındırma, bir alan adı kaydı; başka da bir şey değil). Google AdSense'ten gelen görüntülü reklamlar bu masrafı karşılıyor — eğer iş büyürse ileride de geliştirme ve bakım için harcanan zamanın bir kısmını.
Ücretli bir katman planlanmıyor. Ödeme duvarının ardında "premium ses" yok. AI Voice özelliği de varsayılan ses gibi aynı sebeple ücretsiz: bizim makinemizde değil, sizinkinde çalışıyor; yani sunmak bize hiçbir şeye mal olmuyor.
Tasarım ilkeleri
Korumaya çalıştığımız birkaç kural:
- Metniniz cihazınızda kalır. Tüm sentez istemci tarafında yapılır. Metninize asla erişmiyoruz, asla da erişmeyeceğiz.
- Kayıt yok. Bir araç, 30 saniyelik bir etkileşim için hesap istemeye başladığı an, başarısız olmuştur.
- Karanlık desen yok. Reklamlar sabit yerlerde görüntülü reklamlardır. Pop-under yok, ara reklam yok, "ses oynamadan önce 15 saniye bekle" yok, sahte indirme düğmesi yok.
- Sınırlar konusunda şeffaf. Sentezlenemeyecek tek şey, tarayıcınızın belleğinin alamayacağı kadar uzun bir metindir. Bir şey çalışmıyorsa, sebebi SSS'de olur.
Açık teknoloji üzerine inşa edildi
Quick TTS, birkaç parlak açık kaynak çalışması olmasaydı var olamazdı:
- Kokoro-82M — Kokoro HQ seçeneğini çalıştıran nöral TTS modeli (Apache 2.0).
- Piper (rhasspy tarafından) — Piper seçeneğini çalıştıran evrensel nöral TTS (MIT). Ses modelleri rhasspy/piper-voices'dan: CC-BY 4.0 (LibriTTS-R, VCTK) ve CC0 / kamu malı (Joe) altında özenle seçilmiş bir set sunuyoruz. Lisans ayrıntıları her sesin piper-voices deposundaki MODEL_CARD'ında.
- Transformers.js — ML modellerini tarayıcıda çalıştıran kitaplık.
- vits-web — Piper'ı tarayıcıda çalıştıran VITS ailesi modeller için WASM bağlamaları.
- Web Speech API — on yıldan fazla süredir tarayıcılarda sessiz sedasız var, hâlâ adsız iş atı.
Bunu kim yaptı
Quick TTS, Next Now Agency'deki küçük bir ekip tarafından WSBSynth'in — r/wallstreetbets yorumlarını gerçek zamanlı okuyan bir araç — kardeş projesi olarak geliştirildi. TTS mimarisinin büyük kısmı ikisi arasında ortak — WSBSynth deneme sahasıydı, Quick TTS ise tüketiciye dönük sürümü.
İletişim
Hatalar, geri bildirim, özellik istekleri, basın: hello@quick-tts.com. Daha fazlası için iletişim sayfasına bakın.