AccueilTurfu

Une intelligence artificielle crée des photos à partir de simples mots

Publié le

par Lise Lanot

© Photos Hobby/Unsplash

Malgré des résultats qui semblent peu convaincants, il s'agit d'une avancée certaine en termes de machine learning.

Le chemin du succès est pavé d’obstacles, de détours et de petits dos d’âne. Une intelligence artificielle imaginée par l’Allen Institute for Artificial Intelligence pour réaliser des photos d’après un texte n’est pas encore tout à fait réussie mais constitue une avancée certaine dans le domaine. 

Le contraire existait déjà. Depuis leur invention, les réseaux sociaux tentent, plus ou moins ardemment, de rendre leurs plateformes plus accessibles aux personnes malvoyantes. C’est dans cet objectif que sont conçues des intelligences artificielles décrivant le plus précisément possible des images. Cet essai de créer des images à partir de descriptions textuelles est novateur et, s'il n’apporte peut-être pas une utilité concrète quotidienne, il élargit le champ des possibles du machine learning.

"Une girafe se tient sur un sol en terre près d’un arbre". (© Allen Institute for Artificial Intelligence)

Le premier modèle créé par l’équipe de l’Allen Institure, LXMERT, ne produisait que des "non-sens". Leur nouvelle invention, X-LXMERT, produit des images incohérentes, clairement fausses et déformées, mais qui sont loin d’être des non-sens pour autant. La preuve peut-être que les prochaines révisions de X-LXMERT finiront par nous leurrer en réalisant des photographies d’apparence "réaliste" ?

PetaPixel note que bien que les résultats de X-LXMERT sont peu satisfaisants, ils sont impressionnants au sens où ils montrent à quel point une intelligence artificielle est désormais capable d'"improviser" et créer quelque chose à partir d’informations forcément lacunaires : les phrases ne précisent pas les couleurs, les tailles ou les placements des objets les uns par rapport aux autres par exemple ; pourtant, les images créées ne comportent aucun espace vide.

Ces essais permettront peut-être de grandement améliorer la lecture des sites pour les personnes malvoyantes, entre autres. Vous pouvez tenter de créer vos propres images sur le site de l’Institut – mais ne vous attendez pas à des merveilles.

© Allen Institute for Artificial Intelligence

"Un zèbre marche sur une route et deux voitures approchent". (© Allen Institute for Artificial Intelligence)

"Vue d’un bureau à la maison avec des jouets sur la table". (© Allen Institute for Artificial Intelligence)

"Une femme essaie de skier sur une colline". (© Allen Institute for Artificial Intelligence)

À voir aussi sur techno :