La dernière IA de Google est dotée de capacité de raisonnement
Par Laurence - Publié le
Dans la course à l'IA, plus rien ne semble arrêter Google, qui vient de dévoiler sa nouvelle arme Gemini 2.0 Flash Thinking, un modèle d’intelligence artificielle avancé capable de résoudre des questions complexes tout en exposant ses étapes de réflexion. Ce modèle expérimental, annoncé quelques jours seulement après le lancement de Gemini 2.0, marque une avancée importante dans le domaine de l’IA générative.
Contrairement à la plupart des modèles d’IA qui se contentent de générer une réponse finale, Flash Thinking entend être un peu plus transparent et montrer les étapes de réflexion qu’il suit pour parvenir à une solution. Il a d'ailleurs été spécifiquement entraîné à utiliser ses réflexions pour améliorer son raisonnement, comme l’a expliqué Jeff Dean, responsable scientifique chez Google DeepMind.
Accessible depuis cette adresse, le modèle combine les capacités de raisonnement approfondi avec une version allégée et rapide de Gemini 2.0 Flash, assurant ainsi des réponses en quelques secondes, même pour des questions complexes. En plus des problèmes textuels, Flash Thinking est supposé résoudre des questions impliquant à la fois textes et images. Par exemple, il peut analyser une image contenant des chiffres et répondre à une question basée sur celle-ci en quelques secondes.
Ayant relégué au fin fond de ses placards son essai malheureux de Bard (la première version Gemini qui avait magnifiquement planté lors de sa démonstration), Google mettent en évidence les capacités impressionnantes de Gemini 2.0 Flash Thinking. Ce dernier a résolu un problème de physique complexe en moins de 40 secondes, en expliquant les étapes nécessaires pour parvenir à une solution.
Le but est ici multiple : aider les étudiants à comprendre des concepts complexes en fournissant des explications détaillées et structurées, résoudre des problèmes nécessitant une logique avancée et une analyse rapide, enfin analyser et résoudre des situations impliquant des données multimodales.
Avec Flash Thinking, Google renforce sa position face à des concurrents comme OpenAI et Anthropic en détaillant son mode de pensée -comme un humain pourrait-on dire. Cette innovation pourrait représenter une réponse directe aux capacités avancées d’outils comme GPT-4.
CQFD
Contrairement à la plupart des modèles d’IA qui se contentent de générer une réponse finale, Flash Thinking entend être un peu plus transparent et montrer les étapes de réflexion qu’il suit pour parvenir à une solution. Il a d'ailleurs été spécifiquement entraîné à utiliser ses réflexions pour améliorer son raisonnement, comme l’a expliqué Jeff Dean, responsable scientifique chez Google DeepMind.
Accessible depuis cette adresse, le modèle combine les capacités de raisonnement approfondi avec une version allégée et rapide de Gemini 2.0 Flash, assurant ainsi des réponses en quelques secondes, même pour des questions complexes. En plus des problèmes textuels, Flash Thinking est supposé résoudre des questions impliquant à la fois textes et images. Par exemple, il peut analyser une image contenant des chiffres et répondre à une question basée sur celle-ci en quelques secondes.
Des démonstrations impressionnantes
Ayant relégué au fin fond de ses placards son essai malheureux de Bard (la première version Gemini qui avait magnifiquement planté lors de sa démonstration), Google mettent en évidence les capacités impressionnantes de Gemini 2.0 Flash Thinking. Ce dernier a résolu un problème de physique complexe en moins de 40 secondes, en expliquant les étapes nécessaires pour parvenir à une solution.
Le but est ici multiple : aider les étudiants à comprendre des concepts complexes en fournissant des explications détaillées et structurées, résoudre des problèmes nécessitant une logique avancée et une analyse rapide, enfin analyser et résoudre des situations impliquant des données multimodales.
Avec Flash Thinking, Google renforce sa position face à des concurrents comme OpenAI et Anthropic en détaillant son mode de pensée -comme un humain pourrait-on dire. Cette innovation pourrait représenter une réponse directe aux capacités avancées d’outils comme GPT-4.