La dernière IA de Microsoft créé des vidéos impressionnantes de réalisme !
Par Laurence - Publié le
Depuis longtemps, Microsoft a flairé le bon coup avec l'Intelligence Artificielle, dépensant des milliards de dollars en recherche et développement et investissements bien ciblés. La firme vient d'ailleurs de dévoiler une IA qui permet de créer une vidéo à partir d'une photographie -mieux que dans Harry Potter !
De son petit nom VASA-1, cette IA va partir d'une photo prise en mode portrait, mais également reprendre la voix de la personne, pour créer une vidéo
Sur X (ex Twitter) Bindu Reddy, CEO d'AbacusAI, en montre d'ailleurs un exemple bluffant, même si certains pointilleux pourraient voir quelques saccades par intermittence !
Cette IA reste pour l'instant limitée, elle ne génère que des vidéos en 512x512 mégapixels, et en 40 images par seconde en streaming, voire 45 images par seconde en mode de traitement par lots hors ligne. Il n'est possible de créer une vidéo que sur la base d'un buste et les animations au niveau des cheveux (le plus difficile) restent basiques.
Sur la page dédiée à cette technologie, Microsoft fournit de nombreux exemples, montrant comment les équipes ont travaillé sur les mouvements faciaux en fonction des sentiments ressentis, comme la colère, la surprise, la joie ou la tristesse. Un travail de titan !
Néanmoins, elle dispose d'un avenir prometteur dans les jeux vidéos ou le cinéma, peut-être même effrayant si elle tombait entre de mauvaises mains. On pense évidemment à des utilisations détournées, et bien évidemment des tentatives d'arnaque, de désinformation, ou encore usurpation d'identité.
D'autant plus que d'autres firmes bossent sur des procédés similaires, comme Open AI (ChatGPT) qui vient de présenter son dernier bébé, Voice Engine, un outil destiné à copier des voix en quelques secondes. Mais pour le moment, il entend en limiter l'utilisation pour éviter toute fin malveillante.
Des photos qui parlent
De son petit nom VASA-1, cette IA va partir d'une photo prise en mode portrait, mais également reprendre la voix de la personne, pour créer une vidéo
hyper réaliste. On a réellement l'impression qu'il s'agit vraiment d'une personne qui a été filmée en train de s'exprimer face caméra : les détails et les mouvements du visage sont correctement rendus, la synchronisation entre les lèvres et les mots prononcés, bien que perfectible quand on y regarde de près, est précise, ainsi que les petits tics comme le fait de fermer les yeux ou de hocher la tête.
Sur X (ex Twitter) Bindu Reddy, CEO d'AbacusAI, en montre d'ailleurs un exemple bluffant, même si certains pointilleux pourraient voir quelques saccades par intermittence !
Une utilisation encadrée et limitée
Cette IA reste pour l'instant limitée, elle ne génère que des vidéos en 512x512 mégapixels, et en 40 images par seconde en streaming, voire 45 images par seconde en mode de traitement par lots hors ligne. Il n'est possible de créer une vidéo que sur la base d'un buste et les animations au niveau des cheveux (le plus difficile) restent basiques.
Sur la page dédiée à cette technologie, Microsoft fournit de nombreux exemples, montrant comment les équipes ont travaillé sur les mouvements faciaux en fonction des sentiments ressentis, comme la colère, la surprise, la joie ou la tristesse. Un travail de titan !
Néanmoins, elle dispose d'un avenir prometteur dans les jeux vidéos ou le cinéma, peut-être même effrayant si elle tombait entre de mauvaises mains. On pense évidemment à des utilisations détournées, et bien évidemment des tentatives d'arnaque, de désinformation, ou encore usurpation d'identité.
D'autant plus que d'autres firmes bossent sur des procédés similaires, comme Open AI (ChatGPT) qui vient de présenter son dernier bébé, Voice Engine, un outil destiné à copier des voix en quelques secondes. Mais pour le moment, il entend en limiter l'utilisation pour éviter toute fin malveillante.