Zone Numerique

Tacotron 2 : la nouvelle voix (impressionnante) de Google

Une nouvelle voix pour les logiciels Google

On le sait, Google travaille constamment à l’amélioration de ses services, c’est le cas notamment de Google Traduction ou encore Google Assistant. Tous deux peuvent en effet compter sur un système de voix artificielle, une voix que l’on juge toujours un peu robotisée, et qui manque franchement de naturel. Ainsi, Google vient d’officialiser Tacotron 2, son nouveau moteur de synthèse vocal, dont le rendu est assez bluffant de réalisme.

Selon certains, cette évolution de la voix de synthèse made in Google est presque impossible à distinguer d’une voix humaine. Pour cela, Google annonce avoir optimisé la manière dont le logiciel va transformer le texte en spectrogramme audio, mais aussi celle dont le logiciel va transformer ce même spectrogramme en un fichier audio.

De cette manière, Google promet non seulement une voix plus précise, dans la manière de retranscrire les textes, mais aussi une prononciation plus claire, la nouvelle voix de synthèse se chargeant de respecter parfaitement les ponctuations, les intonations… Tacotron 2 est ainsi capable de distinguer les deux sens d’un même mot par exemple (et sa prononciation), mais pardonne aussi les fautes d’orthographe, tout en insistant sur des mots écrits en majuscule par exemple.

A l’heure actuelle, cette nouvelle voix est encore en cours de développement mais devrait arriver rapidement dans les différentes applications made in Google. Evidemment, ce sont les anglophones qui seront servis en premier, et qui pourront bientôt profiter de ce nouveau système qui tend à devenir de plus en plus naturel et précis.

Pour se faire une idée de l’efficacité de ce système Tacotron 2, Google a mis en ligne sur Github une flopée de samples audio, permettant de se faire une idée de ce nouveau système assez bluffant.