Question 1

Có thực sự miễn phí và không giới hạn từ không?

Accepted Answer

Có. Không đăng ký, không giới hạn ký tự, không gói trả phí. Dán một dòng tweet hay cả một cuốn tiểu thuyết — đều cùng một công cụ. Chúng tôi giữ miễn phí bằng cách hiển thị quảng cáo.

Question 2

Bạn có lưu văn bản tôi dán vào không?

Accepted Answer

Không. Quick TTS chạy hoàn toàn phía trình duyệt. Văn bản bạn dán được trình duyệt xử lý và không bao giờ được gửi tới máy chủ nào của chúng tôi. Chúng tôi không có log vì nó chưa từng đến đây. Văn bản gần nhất được lưu trong localStorage của trình duyệt để vẫn còn đó nếu bạn lỡ đóng tab, nhưng nó chỉ ở trên thiết bị của bạn.

Question 3

Khác nhau giữa giọng mặc định và "AI Voice" là gì?

Accepted Answer

Mặc định (TTS trình duyệt): bộ máy giọng tích hợp của trình duyệt (Web Speech API), tức thì và chạy trên mọi thiết bị kể cả điện thoại. AI Voice (chỉ chạy trên máy tính): hai bộ máy thần kinh bạn có thể chọn dùng — Piper (~60MB, chạy trong WebAssembly) và Kokoro HQ (~80MB, chạy trên GPU của bạn qua WebGPU trong Chrome/Edge trên máy tính). Cả hai đều chạy cục bộ; văn bản của bạn không rời trình duyệt.

Question 4

AI Voice có gửi văn bản của tôi về máy chủ không?

Accepted Answer

Không. Cả Piper và Kokoro đều chạy hoàn toàn trong trình duyệt — Piper qua WebAssembly, Kokoro qua WebGPU. Các yêu cầu mạng duy nhất là tải thư viện và mô hình ban đầu từ jsDelivr và Hugging Face. Sau đó, việc biến văn bản thành âm thanh diễn ra trên thiết bị của bạn.

Question 5

Nó có chạy trên điện thoại không?

Accepted Answer

Trên điện thoại bạn dùng được TTS trình duyệt — nó hoạt động ở mọi nơi với giọng tích hợp sẵn của điện thoại. AI Voice (cả Piper và Kokoro HQ) hiện chỉ chạy trên máy tính. Piper-WASM chạy không ổn trên iOS khi thử nghiệm (âm thanh trục trặc và treo lâu), còn Kokoro cần WebGPU mà GPU di động hiện chưa chạy ổn định. Khi những vấn đề này được khắc phục, chúng tôi sẽ bật lại AI Voice trên di động.

Question 6

Tôi có thể dùng âm thanh cho mục đích thương mại không (YouTube, podcast, sản phẩm)?

Accepted Answer

Có. Piper dùng giấy phép MIT và chúng tôi đóng gói một bộ giọng tuyển: LibriTTS-R và VCTK theo CC-BY 4.0 (dùng thương mại được nếu ghi nguồn), Joe theo CC0 / phạm vi công cộng. Kokoro-82M theo Apache 2.0. Phần TTS trình duyệt dùng giọng tích hợp của hệ điều hành, theo điều khoản của Microsoft, Apple hoặc Google. Chúng tôi không nhận quyền với âm thanh được tạo ra; bạn có trách nhiệm tuân thủ giấy phép của mô hình tương ứng.

Question 7

Văn bản có thể dài bao nhiêu?

Accepted Answer

Bao lâu cũng được. Chúng tôi cắt khúc đầu vào và phát theo dòng, nên dán một tài liệu 50.000 từ cũng chạy theo cùng cơ chế như dán một câu — chỉ là tốn thời gian hơn để nghe hết. Với AI Voice, việc tạo và phát chạy song song nên không phải đợi lâu lúc đầu.

Question 8

Vì sao lần đầu phát AI Voice lâu khởi động vậy?

Accepted Answer

Lần đầu bạn chuyển sang một bộ máy AI, trình duyệt phải tải mô hình về — ~60MB cho Piper, ~80MB cho Kokoro HQ. Tuỳ kết nối, mất từ vài giây đến một phút. Sau đó nó được lưu vào cache trình duyệt, các lần sau đều nhanh.

Question 9

Tôi đang dùng máy công ty và AI Voice cứ kẹt ở "Đang tải..."

Accepted Answer

Một số mạng nội bộ doanh nghiệp chặn jsDelivr hoặc Hugging Face — đây là các CDN host Piper và Kokoro. Nếu cả hai bộ máy AI đều không khởi tạo được, gần như chắc chắn là do đó. TTS trình duyệt không cần tải bất kỳ thứ gì từ ngoài, hãy thử dùng nó.

Question 10

Tại sao tôi thấy quảng cáo?

Accepted Answer

Quảng cáo là cách chúng tôi trả tiền tên miền, host và thời gian bảo trì công cụ. Đó là đánh đổi để giữ miễn phí, không giới hạn. Nếu bạn ghét quảng cáo, chúng tôi tôn trọng — và bạn cứ tự nhiên dùng trình chặn quảng cáo của trình duyệt.

Question 11

Có theo dõi thao tác bàn phím của tôi không?

Accepted Answer

Không. Chúng tôi không chạy keylogger. Xem chính sách quyền riêng tư để biết toàn bộ chi tiết.

FAQ