Accueil » Actualités » Tacotron 2: une voix artificielle bluffante, proche d’une voix humaine

Tacotron 2: une voix artificielle bluffante, proche d’une voix humaine

Par Ruby Charpentier

En cette fin d’année, Google a présenté sa toute nouvelle voix que l’on retrouvera probablement sur Google Assistant et Google Traduction. Et force est de constater que ce dispositif, Tacotron 2, est particulièrement réussi, tant la ressemblance avec une voix humaine est forte.

Tacotron 2, le nouveau dispositif vocal de Google

Les résultats obtenus par Google à partir de son système vocal, Tacotron 2, sont tout simplement impressionnants. En effet, le flux audio généré peut vraiment tromper, tant la voix humaine est parfaitement reproduite. Et les tests récents présentés par Google viennent bien de le confirmer.

Un système de notation sonore a attribué la note de 4,53 pour Tacotron 2, là où la voix humaine a obtenu 4,58. De quoi satisfaire Google, qui pourra ainsi alimenter Google Assistant et Google Traduction de manière optimale. Quant aux avancées technologiques de Tacotron 2, elles sont dues à deux réseaux neuronaux.

Les deux dispositifs ont chacun un objectif bien précis. Le premier effectue un séquençage du texte qui sert par la suite à visualiser à l’aide d’un diagramme l’intensité propre aux différentes fréquences audio.

Une voix artificielle, quasi humaine…

Le deuxième réseau neuronal s’intitule quant à lui WaveNet et il a été conçu à la base par une société d’intelligence artificielle plutôt prestigieuse, puisqu’il s’agit de DeepMind. La société a déjà fait fonctionner l’anglais et le japonais sur Google Assistant, à l’aide de voix qui n’émanent pas de sons humains, mais d’un dispositif proche de Tacotron 2.

Ainsi, ce second dispositif neuronal permet la création automatique de fichiers audio. L’ensemble aboutit à un dispositif particulièrement puissant, puisque Tacotron 2 peut faire face à la complexité, notamment appréhender des mots pas faciles à prononcer. Tacotron a aussi la capacité de faire évoluer son intonation, en fonction de la ponctuation qui précède ou suit un mot.

Et bonne nouvelle, cette technologie inédite devrait être accessible au plus grand nombre d’ici peu, puisque Tacotron 2 viendra se substituer aux voix que l’on entend aujourd’hui sur plusieurs applis Google. Attention toutefois, en France il faudra être encore un peu patient, puisqu’assez logiquement, ce sont les anglophones qui devraient bénéficier en premier du dispositif.

Vous aimerez aussi

S’abonner
Notifier de
guest
0 Commentaires
Commentaires en ligne
Voir tous les commentaires
0
Nous serions ravis d'avoir votre avis, laissez un commentaire !x