소개
Quick TTS가 존재하는 이유는 단순합니다. 다른 거의 모든 무료 텍스트 음성 변환 도구가 1,000단어에서 막거나, 가입을 강요하거나, 구독으로 끌어들이려 하기 때문입니다. 이곳은 그렇지 않습니다.
이 도구는 무엇인가
Quick TTS는 붙여넣은 어떤 텍스트든 브라우저에서 그대로 읽어 주는 싱글 페이지 웹 앱입니다. 계정도, 글자 수 제한도, 워터마크도, "계속하려면 업그레이드"도 없습니다. 텍스트 박스, 재생 버튼, 그리고 음성 — 그게 전부입니다.
내부에는 두 가지 음성 엔진이 있습니다.
- 브라우저에 내장된 음성(Web Speech API). 데스크톱과 모바일은 물론, 약간 오래된 환경에서도 무난히 동작합니다.
- AI Voice. Kokoro라는 신경망 TTS 모델을 WebGPU로 GPU에서 돌려, 훨씬 자연스러운 낭독을 제공하는 선택 옵션입니다. 지금은 데스크톱 Chrome / Edge에서만 지원됩니다.
왜 무료인가
사이트 운영비는 한 달 커피 한 잔 값 정도입니다(Firebase 정적 호스팅과 도메인 등록, 그게 전부). Google AdSense의 디스플레이 광고로 그 비용을 충당하고, 자리를 잡으면 개발과 유지에 들어가는 시간 일부도 보전합니다.
유료 등급 계획은 없습니다. 결제벽 너머에 숨긴 "프리미엄 음성"도 없습니다. AI Voice가 무료인 이유는 기본 기능이 무료인 이유와 같습니다 — 여러분의 기기에서 동작하므로, 저희 입장에서 추가 비용이 들지 않습니다.
설계 원칙
지키려는 몇 가지 원칙이 있습니다.
- 여러분의 텍스트는 기기 밖으로 나가지 않습니다. 모든 합성은 클라이언트 측에서 일어납니다. 저희는 여러분의 텍스트를 받지 않으며, 앞으로도 받지 않을 것입니다.
- 가입 없음. 30초짜리 상호작용을 위해 계정을 요구하는 도구라면, 그 시점에 이미 실패한 것입니다.
- 다크 패턴 없음. 광고는 고정 위치의 디스플레이 광고뿐. 팝언더, 인터스티셜, "오디오 재생까지 15초 대기", 가짜 다운로드 버튼, 전부 없습니다.
- 제한은 솔직하게 공개. 합성할 수 없는 유일한 경우는 브라우저 메모리에 담기에 너무 긴 텍스트입니다. 동작하지 않는 이유는 FAQ에 적어 두었습니다.
오픈 기술 위에 만들었습니다
훌륭한 오픈소스 작업물이 없었다면 Quick TTS는 존재하지 않았을 것입니다.
- Kokoro-82M — Kokoro HQ 옵션을 구동하는 신경망 TTS 모델(Apache 2.0).
- Piper (rhasspy 제작) — Piper 옵션을 구동하는 범용 신경망 TTS(MIT). 음성 모델은 rhasspy/piper-voices에서 가져왔으며, CC-BY 4.0(LibriTTS-R, VCTK)와 CC0 / 퍼블릭 도메인(Joe) 라이선스의 큐레이션된 세트를 포함합니다. 라이선스 세부 사항은 piper-voices 저장소의 각 음성 MODEL_CARD를 참고하세요.
- Transformers.js — ML 모델을 브라우저에서 실행하게 해 주는 라이브러리.
- vits-web — Piper를 브라우저에서 돌리기 위한 VITS 계열 모델용 WASM 바인딩.
- Web Speech API — 10년 넘게 브라우저에 조용히 탑재되어 있는, 칭찬받지 못한 일꾼.
누가 만들었나
Quick TTS는 Next Now Agency의 작은 팀이, WSBSynth (실시간 r/wallstreetbets 댓글 낭독 서비스)의 자매 프로젝트로 만들었습니다. TTS 아키텍처 대부분이 양쪽에서 공유됩니다 — WSBSynth는 시험장이었고, Quick TTS는 일반 사용자에게 친화적인 버전입니다.
문의
버그, 피드백, 기능 요청, 언론 문의: hello@quick-tts.com. 자세한 내용은 문의 페이지를 참조하세요.