FAQ
Trả lời nhanh cho những câu hỏi thường gặp.
Có thực sự miễn phí và không giới hạn từ không?
Có. Không đăng ký, không giới hạn ký tự, không gói trả phí. Dán một dòng tweet hay cả một cuốn tiểu thuyết — đều cùng một công cụ. Chúng tôi giữ miễn phí bằng cách hiển thị quảng cáo.
Bạn có lưu văn bản tôi dán vào không?
Không. Quick TTS chạy hoàn toàn phía trình duyệt. Văn bản bạn dán được trình duyệt xử lý và không bao giờ được gửi tới máy chủ nào của chúng tôi. Chúng tôi không có log vì nó chưa từng đến đây.
Văn bản gần nhất được lưu trong localStorage của trình duyệt để vẫn còn đó nếu bạn lỡ đóng tab, nhưng nó chỉ ở trên thiết bị của bạn. Xoá dữ liệu trang trong trình duyệt là sạch.
Khác nhau giữa giọng mặc định và "AI Voice" là gì?
Mặc định (TTS trình duyệt): bộ máy giọng tích hợp của trình duyệt (Web Speech API). Tức thì, chạy trên mọi thiết bị, nghe như giọng TTS chuẩn. Bộ giọng cụ thể tuỳ vào hệ điều hành — Mac có Samantha, Windows có Zira và Natasha, Android và iOS có bộ riêng.
AI Voice (chỉ chạy trên máy tính) là hai bộ máy thần kinh bạn có thể chọn dùng. Cả hai đều chạy cục bộ trên thiết bị của bạn sau một lần tải về — văn bản của bạn không rời trình duyệt.
- Piper — tải về ~60MB, chạy trong WebAssembly. Hoạt động trên mọi trình duyệt máy tính. Nghe tự nhiên hơn hẳn so với TTS trình duyệt.
- Kokoro HQ — chất lượng cao nhất, tải về ~80MB, chạy trên GPU của bạn qua WebGPU (Chrome, Edge trên máy tính, hoặc các trình duyệt hỗ trợ WebGPU khác). Gần với một người dẫn truyện thật hơn là một cái máy.
AI Voice có gửi văn bản của tôi về máy chủ không?
Không. Cả Piper và Kokoro đều chạy hoàn toàn trong trình duyệt — Piper qua WebAssembly, Kokoro qua WebGPU. Các yêu cầu mạng duy nhất là tải thư viện và mô hình ban đầu từ jsDelivr và Hugging Face. Sau đó, việc biến văn bản thành âm thanh diễn ra trên thiết bị của bạn.
Nó có chạy trên điện thoại không?
Trên điện thoại bạn dùng được TTS trình duyệt — nó hoạt động ở mọi nơi với giọng tích hợp sẵn của điện thoại. AI Voice (cả Piper và Kokoro HQ) hiện chỉ chạy trên máy tính: Piper-WASM chạy không ổn trên iOS khi thử nghiệm (âm thanh trục trặc và treo lâu), còn Kokoro cần WebGPU mà GPU di động hiện chưa chạy ổn định. Khi những vấn đề này được khắc phục, chúng tôi sẽ bật lại AI Voice trên di động.
Tôi có thể dùng âm thanh cho mục đích thương mại không (YouTube, podcast, sản phẩm)?
Có, kèm một lưu ý: bạn nên ghi nguồn mô hình giọng nền tảng trong phần credit hoặc mô tả của dự án.
- TTS trình duyệt: dùng giọng tích hợp của hệ điều hành. Microsoft, Apple và Google đều có điều khoản riêng cho việc dùng thương mại các giọng hệ thống — nói chung được phép cho mục đích nhỏ lẻ và phụ trợ, nhưng nếu bạn phát hành ở quy mô lớn hãy kiểm tra tài liệu của giọng cụ thể.
- Piper: bộ máy theo MIT. Chúng tôi đóng gói một bộ giọng tuyển: LibriTTS-R và VCTK theo CC-BY 4.0 (dùng thương mại được nếu ghi nguồn), Joe theo CC0 / phạm vi công cộng (không ràng buộc). Việc ghi nguồn cho giọng CC-BY thường chỉ cần một dòng trong mô tả video/podcast như "Voice by Piper TTS — LibriTTS-R / VCTK, CC-BY 4.0".
- Kokoro HQ: mô hình theo giấy phép Apache 2.0 — cho phép sử dụng thương mại. Apache 2.0 không bắt buộc ghi nguồn nhưng chúng tôi khuyến nghị ghi Kokoro-82M trong phần credit như một thực hành tốt.
Chúng tôi không nhận quyền nào với âm thanh bạn tạo ra. Bạn chịu trách nhiệm tuân thủ giấy phép mô hình trong tình huống cụ thể của mình.
Văn bản có thể dài bao nhiêu?
Bao lâu cũng được. Chúng tôi cắt khúc đầu vào và phát theo dòng, nên dán một tài liệu 50.000 từ cũng chạy theo cùng cơ chế như dán một câu — chỉ là tốn thời gian hơn để nghe hết. Với AI Voice, việc tạo và phát chạy song song nên không phải đợi lâu lúc đầu.
Vì sao lần đầu phát AI Voice lâu khởi động vậy?
Lần đầu bạn chuyển sang một bộ máy AI, trình duyệt phải tải mô hình về — ~60MB cho Piper, ~80MB cho Kokoro HQ. Tuỳ kết nối, mất từ vài giây đến một phút. Sau đó nó được lưu vào cache trình duyệt, các lần sau đều nhanh.
Tôi đang dùng máy công ty và AI Voice cứ kẹt ở "Đang tải..."
Một số mạng nội bộ doanh nghiệp chặn jsDelivr hoặc Hugging Face — đây là các CDN host Piper và Kokoro. Nếu cả hai bộ máy AI đều không khởi tạo được, gần như chắc chắn là do đó. TTS trình duyệt không cần tải bất kỳ thứ gì từ ngoài, nên là phương án dự phòng tốt trong môi trường bị siết chặt.
Tại sao tôi thấy quảng cáo?
Quảng cáo là cách chúng tôi trả tiền tên miền, host và thời gian bảo trì công cụ. Đó là đánh đổi để giữ miễn phí, không giới hạn. Nếu bạn ghét quảng cáo, chúng tôi tôn trọng — và bạn cứ tự nhiên dùng trình chặn quảng cáo của trình duyệt. Chúng tôi sẽ không "đánh vào lương tâm" bạn.
Có theo dõi thao tác bàn phím của tôi không?
Không. Chúng tôi không chạy phân tích hay keylogger. Xem Chính sách quyền riêng tư để biết toàn bộ chi tiết.
Có lỗi / Tôi muốn góp ý
Gửi email tới hello@quick-tts.com. Hãy ghi rõ trình duyệt và hệ điều hành.