L'IA de Google crée des clichés photoréalistes à partir d'un texte
Par June Cantillon - Mis à jour le
La division Brain Team de Google Research vient ainsi concurrencer avec Imagen d'autres modèles d'apprentissage automatique, dont DALL-E créé par OpenAI (l'organisation de recherche sur l’intelligence artificielle présidée par Elon Musk et Sam Altman) tout en affirmant que les clichés provenant d'Imagen ont davantage convaincu un groupe de personnes chargé d'examiner les images générées par les deux IA grâce à
un degré de photoréalisme sans précédent et un niveau profond de compréhension du langage. Les chercheurs ont pour cela créé un test appelé DrawBench comprenant une liste de 200 phrases qui ont ensuite été analysées par chaque modèle. Des personnes ont ensuite été invitées à évaluer chaque image afin d'en noter la qualité et la correspondance entre le texte fourni et l'image générée.
Un couple de robots dine avec la Tour Eiffel en arrière-plan
Si Google permet de jouer avec l'IA grâce à une expérience intégrée au site (voir cliché ci-dessous) ne comprenant que quelques entrées, la firme n'envisage pas de rendre accessible son programme en l'état au grand public afin d'éviter une utilisation biaisée ou abusive. En effet, l'IA ayant été nourrie avec un grand nombre d'images provenant du net sans que ces dernières ne soient triées, Imagen aurait hérité de préjugés sociaux, impliquant ainsi des résultats reflètant parfois des
stéréotypes sociaux, des points de vue oppressifs et des associations désobligeantes ou autrement nuisibles à des groupes d'identité marginalisés