Accueil » Actualités » Une nouvelle intelligence artificielle avec des capacités optimisées en termes de jeux

Une nouvelle intelligence artificielle avec des capacités optimisées en termes de jeux

Par Ruby Charpentier

Deepmind, filiale d’Alphabet, vient de concevoir une nouvelle intelligence artificielle avec des capacités redoutables, puisqu’elle peut apprendre seule et maîtriser des jeux complexes comme les échecs. Elle supplante même d’autres intelligences artificielles.

Deepmind crée une intelligence artificielle avec de belles capacités, AlphaZero

La filiale d’Alphabet, Deepmind, fait encore parler d’elle, la société vient de concevoir une nouvelle intelligence artificielle, AlphaZero, qui propose encore des améliorations en termes de capacités. Cette fois-ci, les algorithmes n’ont pas eu besoin d’aide pour apprendre à jouer aux échecs, au Go ainsi qu’au Shogi, un jeu japonais d’échecs.

 

Seules les règles du jeu ont été fournies à AlphaZero. Et le résultat est bluffant : en sollicitant les réseaux neuronaux, l’IA est non seulement parvenue à maîtriser ces différents jeux plutôt complexes, mais elle est devenue, selon Deepmind, « le plus puissant joueur de l’histoire ».

 

Ce n’est pas la première fois que Deepmind s’illustre dans ce domaine. Déjà, en 2017, son intelligence artificielle AlphaGo avait battu de manière aisée le meilleur joueur du monde de Go. Fort de ce résultat, Deepmind a continué à travailler sur son IA afin que celle-ci n’ait plus besoin de supervision humaine pour apprendre des jeux complexes.

AlphaZero, plus fort que d’autres intelligences artificielles

Cela a fini par donner AlphaZero, une IA aux résultats redoutables, à tel point que trois intelligences artificielles de renom ont été balayées. AlphaZero a ainsi affronté AlphaGoZero, Stockfish – championne du monde d’échec- et Elmo dont la spécialité est le shogi. Mais tout n’a pas été si simple pour AlphaZero.

 

En effet, il a fallu des millions de parties pour l’IA pour parvenir à ses fins. AlphaZero a notamment appris de ses erreurs pour progresser, ce que l’on appelle en IA un apprentissage par renforcement. Au final, AlphaZero a mis neuf heures pour maîtriser les échecs et douze heures pour le shogi.Cela a été plus long avec le Go, soit 13 jours.

 

AlphaZero a ensuite battu Elmo en deux heures, Stockfish en quatre et AlphaGo en trente heures. AlphaZero a ainsi sollicité 5000 TPU pour apprendre. Quand on sait qu’un TPU peut traiter 100 millions d’images par jour, on imagine l’effort qui a été fait en termes de machine learning…

 

S’abonner
Notifier de
guest
0 Commentaires
Commentaires en ligne
Voir tous les commentaires
0
Nous serions ravis d'avoir votre avis, laissez un commentaire !x