소개

Quick TTS가 존재하는 이유는 단순합니다. 다른 거의 모든 무료 텍스트 음성 변환 도구가 1,000단어에서 막거나, 가입을 강요하거나, 구독으로 끌어들이려 하기 때문입니다. 이곳은 그렇지 않습니다.

이 도구는 무엇인가

Quick TTS는 붙여넣은 어떤 텍스트든 브라우저에서 그대로 읽어 주는 싱글 페이지 웹 앱입니다. 계정도, 글자 수 제한도, 워터마크도, "계속하려면 업그레이드"도 없습니다. 텍스트 박스, 재생 버튼, 그리고 음성 — 그게 전부입니다.

내부에는 두 가지 음성 엔진이 있습니다.

브라우저에 내장된 음성(Web Speech API). 데스크톱과 모바일은 물론, 약간 오래된 환경에서도 무난히 동작합니다.
AI Voice. Kokoro라는 신경망 TTS 모델을 WebGPU로 GPU에서 돌려, 훨씬 자연스러운 낭독을 제공하는 선택 옵션입니다. 지금은 데스크톱 Chrome / Edge에서만 지원됩니다.

왜 무료인가

사이트 운영비는 한 달 커피 한 잔 값 정도입니다(Firebase 정적 호스팅과 도메인 등록, 그게 전부). Google AdSense의 디스플레이 광고로 그 비용을 충당하고, 자리를 잡으면 개발과 유지에 들어가는 시간 일부도 보전합니다.

유료 등급 계획은 없습니다. 결제벽 너머에 숨긴 "프리미엄 음성"도 없습니다. AI Voice가 무료인 이유는 기본 기능이 무료인 이유와 같습니다 — 여러분의 기기에서 동작하므로, 저희 입장에서 추가 비용이 들지 않습니다.

설계 원칙

지키려는 몇 가지 원칙이 있습니다.

여러분의 텍스트는 기기 밖으로 나가지 않습니다. 모든 합성은 클라이언트 측에서 일어납니다. 저희는 여러분의 텍스트를 받지 않으며, 앞으로도 받지 않을 것입니다.
가입 없음. 30초짜리 상호작용을 위해 계정을 요구하는 도구라면, 그 시점에 이미 실패한 것입니다.
다크 패턴 없음. 광고는 고정 위치의 디스플레이 광고뿐. 팝언더, 인터스티셜, "오디오 재생까지 15초 대기", 가짜 다운로드 버튼, 전부 없습니다.
제한은 솔직하게 공개. 합성할 수 없는 유일한 경우는 브라우저 메모리에 담기에 너무 긴 텍스트입니다. 동작하지 않는 이유는 FAQ에 적어 두었습니다.

오픈 기술 위에 만들었습니다

훌륭한 오픈소스 작업물이 없었다면 Quick TTS는 존재하지 않았을 것입니다.

Kokoro-82M — Kokoro HQ 옵션을 구동하는 신경망 TTS 모델(Apache 2.0).
Piper (rhasspy 제작) — Piper 옵션을 구동하는 범용 신경망 TTS(MIT). 음성 모델은 rhasspy/piper-voices에서 가져왔으며, CC-BY 4.0(LibriTTS-R, VCTK)와 CC0 / 퍼블릭 도메인(Joe) 라이선스의 큐레이션된 세트를 포함합니다. 라이선스 세부 사항은 piper-voices 저장소의 각 음성 MODEL_CARD를 참고하세요.
Transformers.js — ML 모델을 브라우저에서 실행하게 해 주는 라이브러리.
vits-web — Piper를 브라우저에서 돌리기 위한 VITS 계열 모델용 WASM 바인딩.
Web Speech API — 10년 넘게 브라우저에 조용히 탑재되어 있는, 칭찬받지 못한 일꾼.

누가 만들었나

Quick TTS는 Next Now Agency의 작은 팀이, WSBSynth (실시간 r/wallstreetbets 댓글 낭독 서비스)의 자매 프로젝트로 만들었습니다. TTS 아키텍처 대부분이 양쪽에서 공유됩니다 — WSBSynth는 시험장이었고, Quick TTS는 일반 사용자에게 친화적인 버전입니다.

문의

버그, 피드백, 기능 요청, 언론 문의: hello@quick-tts.com. 자세한 내용은 문의 페이지를 참조하세요.