Siri sera-t-elle bientôt capable de modifier vos photos ?
Par June Cantillon - Publié le
De grands espoirs reposent sur les épaules d'iOS 18, censé être une mise à jour historique pour les iPhone, notamment grâce à l'intégration des travaux d'Apple sur l'IA.
Lors de la présentation des derniers résultats d'Apple, Tim Cook a promis des annonces sur l'IA un peu plus tard cette année. Il n'en faut pas plus pour espérer un iOS 18 présenté à la WWDC et intégrant une version survitaminée de Siri, capable de s'appuyer sur l'IA générative pour proposer des services comme ceux de ChatGPT ou encore Dall-E, pour ne citer que les produits d'OpenAI.
Apple ne communique pas officiellement sur ces avancées sur le secteur des grands modèles de langage mais ne reste pourtant pas les bras croisés, et nous avons pu voir quelques exemples de ses travaux récemment, par exemple avec Ferret, ou encore afin de pouvoir utiliser le stockage des iPhone afin de palier le manque de RAM, dont les iA génératives sont très gourmandes.
Un autre pan des travaux d'Apple a été présenté lors de l'International Conference on Learning Representations 2024. Cette IA nommée MGIE, pour MLLM-Guided Image Editing (MLLM pour Multimodal Large Language Model, ou grand modèle de langage multimodal) permettrait de modifier une photo via un texte ou une requête vocale en langage naturel. Ainsi, MGIE pourrait modifier le contraste ou la luminosité, mais également modifier plus profondément le cliché afin d'ajouter ou de retirer des éléments.
Avec un peu d'imagination on pourrait alors espérer pouvoir demander à Siri de retirer cette personne en arrière-plan qui vient gâcher votre beau coucher de soleil, tout en exigeant un ciel aux couleurs plus orangées et un contraste amélioré (ou un troisième bras sur le front de votre compagne/compagnon si vous sentez d'humeur taquine). Reste savoir si ce doux rêve ne se soldera pas par une réponse
Le fantasme d'un Siri plus puissant et utile
Lors de la présentation des derniers résultats d'Apple, Tim Cook a promis des annonces sur l'IA un peu plus tard cette année. Il n'en faut pas plus pour espérer un iOS 18 présenté à la WWDC et intégrant une version survitaminée de Siri, capable de s'appuyer sur l'IA générative pour proposer des services comme ceux de ChatGPT ou encore Dall-E, pour ne citer que les produits d'OpenAI.
Apple ne communique pas officiellement sur ces avancées sur le secteur des grands modèles de langage mais ne reste pourtant pas les bras croisés, et nous avons pu voir quelques exemples de ses travaux récemment, par exemple avec Ferret, ou encore afin de pouvoir utiliser le stockage des iPhone afin de palier le manque de RAM, dont les iA génératives sont très gourmandes.
MGIE : une IA permettant d'éditer les photos
Un autre pan des travaux d'Apple a été présenté lors de l'International Conference on Learning Representations 2024. Cette IA nommée MGIE, pour MLLM-Guided Image Editing (MLLM pour Multimodal Large Language Model, ou grand modèle de langage multimodal) permettrait de modifier une photo via un texte ou une requête vocale en langage naturel. Ainsi, MGIE pourrait modifier le contraste ou la luminosité, mais également modifier plus profondément le cliché afin d'ajouter ou de retirer des éléments.
Avec un peu d'imagination on pourrait alors espérer pouvoir demander à Siri de retirer cette personne en arrière-plan qui vient gâcher votre beau coucher de soleil, tout en exigeant un ciel aux couleurs plus orangées et un contraste amélioré (ou un troisième bras sur le front de votre compagne/compagnon si vous sentez d'humeur taquine). Reste savoir si ce doux rêve ne se soldera pas par une réponse
à la Siri, du genre,
je n'ai pas trouvé de réponse, rendez-vous sur Safari pour en apprendre davantage sur le sujet.