Les meilleures voix TTS françaises 2026 : Hortense, Thomas et Edge Online comparées

Publié 10 mai 2026

Choisir une voix de synthèse vocale française en 2026 n'est plus le compromis qu'on a connu pendant quinze ans. Entre les voix neuronales d'Edge Online, le corpus Thomas/Aurélie d'Apple, la famille Piper et Kokoro qui vient d'arriver, l'écosystème français est devenu honnêtement compétitif. Cet article fait le tri par cas d'usage, sans gonfler le palmarès et sans cacher les manques.

L'écosystème TTS français en 2026

Trois constats orientent les choix actuels. Premièrement, les voix SAPI classiques (Hortense, Julie, Paul) restent partout sur Windows mais n'ont pas vraiment évolué depuis Windows 7 — elles servent surtout pour des messages courts et l'accessibilité hors ligne. Deuxièmement, Edge Online a élargi son catalogue à 11 voix françaises neuronales (4 France, 3 Québec, 2 Belgique, 2 Suisse), qui rivalisent avec les meilleures voix payantes d'il y a deux ans. Troisièmement, Piper offre désormais sept voix françaises hors ligne, dont fr_FR-tom-medium et fr_FR-siwis-medium tiennent largement la route pour de la lecture longue. Kokoro, pour sa part, ne propose qu'une seule voix française (ff_siwis) — c'est la lacune la plus claire à ce jour.

Microsoft Hortense, Julie, Paul : les voix classiques de Windows

Sur tout Windows 10/11, indépendamment du navigateur, trois voix SAPI françaises sont toujours disponibles :

Microsoft Hortense — la voix féminine historique, présente depuis Windows Vista. Articulation claire, prosodie plate. Reconnaissable instantanément.
Microsoft Julie — voix féminine alternative, légèrement plus claire qu'Hortense. Même génération technologique.
Microsoft Paul — l'équivalent masculin. Tonalité plus grave, mais même caractère mécanique.
Microsoft Caroline et Microsoft Claude — voix SAPI canadiennes (fr-CA). Présentes uniquement sur les installations Windows configurées en français canadien, ou téléchargeables comme module linguistique.

Le bon usage de ces voix en 2026 : alertes courtes, accessibilité de base, environnements sans Internet. Elles s'allument instantanément, ne demandent aucun téléchargement de modèle, ne sollicitent ni GPU ni cloud. Pour tout ce qui dépasse trois phrases, les options ci-dessous sont meilleures.

Edge Online : Denise, Henri, Vivienne et 8 autres voix neurales

Le catalogue Azure Neural exposé via le navigateur Edge propose actuellement 11 voix françaises, réparties entre quatre variantes nationales :

France métropolitaine (4 voix) :

Microsoft Denise Online — la voix féminine par défaut. Timbre chaleureux, prosodie naturelle sur des phrases longues. C'est, en pratique, la meilleure voix française gratuite tous catalogues confondus pour de la lecture courante.
Microsoft Henri Online — la contrepartie masculine. Tonalité posée, articulation très claire. Idéal pour de la narration informative.
Microsoft Vivienne Online — alternative féminine à Denise, légèrement plus jeune dans le timbre.
Microsoft Rémy Online — alternative masculine à Henri, voix un peu plus dynamique.

Canada (Québec, 3 voix) :

Microsoft Sylvie Online — féminine québécoise. Capture l'accent montréalais sans le caricaturer.
Microsoft Jean Online — masculine québécoise.
Microsoft Antoine Online — masculine québécoise alternative, registre plus chaleureux que Jean.

Belgique (2 voix) :

Microsoft Charline Online et Microsoft Gérard Online — voix françaises de Belgique. Accent belge reconnaissable mais très soft.

Suisse (2 voix) :

Microsoft Ariane Online et Microsoft Fabrice Online — voix françaises de Suisse romande.

Top 3 personnel pour le français de France : Denise Online en défaut, Henri Online pour la voix masculine, Vivienne Online comme alternative quand Denise commence à se reconnaître. Limitation à connaître : ces voix fonctionnent uniquement dans Microsoft Edge et exigent une connexion Internet — la synthèse passe par Azure. Pour des textes confidentiels (RGPD, données médicales), Piper hors ligne est plus adapté.

Apple Thomas, Aurélie, Daniel : les voix Siri

Sur macOS et iOS, le catalogue français est plus restreint mais la qualité locale est élevée :

Thomas — voix masculine française par défaut. La version Premium (téléchargeable depuis Réglages → Accessibilité → Contenu énoncé) atteint un niveau quasi-Edge Online en synthèse pure, avec l'avantage d'une exécution 100 % locale.
Aurélie (Siri) — voix féminine Siri. Très bien calibrée pour les phrases longues, légèrement plus jeune que Denise Online.
Daniel (Siri) — voix masculine Siri. Alternative à Thomas, registre un peu plus formel.

Apple est aussi le seul fournisseur OS à proposer un français canadien intégré : Amélie (féminine, par défaut au Québec) et Chantal (alternative féminine québécoise). Sur un Mac configuré en français canadien, ces voix s'exposent automatiquement via Web Speech dans tous les navigateurs.

Compromis Apple favorable : qualité quasi-Edge Online, mais sans envoi de texte vers le cloud. Pour des utilisateurs iPhone/Mac soucieux de confidentialité, Thomas Premium ou Aurélie sont le bon point d'équilibre.

Français canadien : Gabriel, Sylvie, Antoine, Jean Online

Le français du Québec est le parent pauvre de la plupart des catalogues, mais Quick TTS rassemble en pratique tout ce qui existe d'utilisable :

Microsoft Sylvie Online, Jean Online, Antoine Online (Edge) — les trois voix neuronales canadiennes. Sylvie est la meilleure voix féminine québécoise gratuite tous catalogues confondus.
Apple Amélie, Chantal — voix Siri québécoises, exécution locale.
Microsoft Caroline, Claude — voix SAPI classiques sous Windows fr-CA.

Limitation importante : ni Piper ni Kokoro ne proposent de voix française canadienne. Pour du fr-CA hors ligne, l'option la plus propre reste Apple Amélie sur macOS/iOS. Sur Windows hors ligne, c'est Caroline SAPI ou rien.

Piper en français : tom, siwis, upmc, gilles, mls

Pour de la synthèse française neuronale hors ligne, Piper est le bon choix. Les modèles tournent en WebAssembly dans le navigateur, ~60 Mo téléchargés une seule fois, puis fonctionnement totalement hors ligne :

fr_FR-tom-medium — voix masculine, qualité moyenne. Très naturelle pour un modèle communautaire ; c'est l'option par défaut recommandée pour le français hors ligne en 2026.
fr_FR-siwis-medium — voix féminine, issue du corpus SIWIS de l'EPFL. Articulation extrêmement nette, parfaite pour de la lecture technique ou pédagogique.
fr_FR-siwis-low — variante plus légère du même corpus. Modèle plus petit, inférence plus rapide, légère dégradation audible.
fr_FR-upmc-medium — voix française, qualité moyenne. Alternative à siwis avec un timbre différent.
fr_FR-mls-medium — voix issue du corpus Multilingual LibriSpeech. Plus neutre que tom ou siwis, parfois un peu plus plate.
fr_FR-mls_1840-low — variante MLS à un seul locuteur, qualité réduite.
fr_FR-gilles-low — voix masculine alternative, qualité basse. Utile sur des appareils contraints.

Recommandation pratique : fr_FR-tom-medium en voix masculine par défaut, fr_FR-siwis-medium en voix féminine par défaut. Les deux suffisent pour 90 % des cas. Lacune réelle de Piper : pas de voix française canadienne.

Kokoro français : ff_siwis

Le modèle Kokoro-82M propose une seule voix française, ff_siwis, dérivée du même corpus SIWIS que la voix Piper du même nom. La qualité est légèrement supérieure à la version Piper grâce à l'architecture StyleTTS2, et l'exécution se fait via WebGPU sur la carte graphique (Chrome ou Edge desktop avec GPU récent), totalement en local.

Honnêteté oblige : pour le français, Kokoro n'apporte pas un avantage écrasant sur Piper. Une seule voix, féminine, issue du même corpus. Si vous voulez la pile WebGPU la plus moderne et n'avez pas besoin d'une voix masculine ou québécoise, Kokoro ff_siwis vaut l'essai. Sinon, Piper offre plus de variété pour le français en 2026.

Quelle voix choisir ?

Décision rapide selon le cas d'usage :

Français de France, qualité maximale en ligne : Edge Online Denise Online (féminine) ou Henri Online (masculine).
Français de France, sans envoi cloud : Apple Thomas Premium / Aurélie sur Mac ou iOS, sinon Piper fr_FR-tom-medium / fr_FR-siwis-medium sur tout autre système.
Français canadien (Québec) : Edge Online Sylvie Online ou Antoine Online en ligne ; Apple Amélie pour du local sur Mac/iOS. Piper et Kokoro ne couvrent pas le fr-CA.
Français belge : Edge Online Charline Online ou Gérard Online. Aucun équivalent neuronal hors Edge.
Français suisse romand : Edge Online Ariane Online ou Fabrice Online. Idem, pas d'équivalent hors Edge.
Lecture longue (livre audio, article 5000+ mots) : Edge Online Denise en ligne, ou Piper fr_FR-tom-medium hors ligne — les deux conservent la prosodie sur la durée.
Texte sensible RGPD : Piper hors ligne (le texte ne quitte jamais l'appareil) ou Apple Premium sur Mac/iOS.
Alertes courtes, latence minimale : voix SAPI Hortense / Julie / Paul. Démarrage instantané, aucun téléchargement.
Linux sans voix néronale OS : Piper fr_FR-tom-medium ou fr_FR-siwis-medium. Kokoro si WebGPU disponible.

À écouter

Ouvrez Quick TTS, collez un paragraphe en français et basculez entre le moteur du navigateur (Edge Online ou Apple), Piper et Kokoro sur le même texte. Vous pouvez même changer de voix au milieu de la lecture — Quick TTS reprend là où la voix précédente s'est arrêtée. C'est la seule manière sérieuse de comparer les voix françaises : votre oreille tranchera mieux qu'un classement écrit, parce qu'un texte journalistique favorise Henri Online, un récit favorise Denise ou tom-medium, un dialogue québécois favorise Sylvie.

Pour aller plus loin, le guide d'utilisation détaille neuf cas pratiques de la synthèse vocale, la FAQ répond aux questions courantes, et la page À propos explique pourquoi Quick TTS exécute toute la synthèse localement (point clé pour la conformité RGPD).