ENFR

Tech • IA • Crypto

Aujourd'hui Topics Vidéos Crypto Archives Favoris

Les nouveaux Omni et Spark de Google viennent de changer l’IA pour toujours

10/10

IAAI Revolution21 mai 2026 à 00:3118:12

Lecteur audio

0:00 / 0:00

INTRO

Google I/O 2026 a mis en avant une montée en puissance rapide de l’IA, de nouveaux modèles Gemini et un virage vers des agents autonomes intégrés à tous les produits et à l’infrastructure.

POINTS CLÉS

Croissance explosive de l’usage de l’IA

Google a indiqué traiter plus de 3,2 quadrillions de tokens par mois, contre 480 trillions un an plus tôt et 9,7 trillions il y a deux ans. L’application Gemini a dépassé 900 millions d’utilisateurs mensuels, soit plus du double sur un an, tandis que les fonctionnalités de recherche dopées à l’IA touchent des milliards d’utilisateurs. Cela marque le passage d’une IA expérimentale à une infrastructure mondiale du quotidien.

Gemini 3.5 Flash défie les meilleurs modèles

Le nouveau Gemini 3.5 Flash surpasse d’anciens modèles phares sur plusieurs benchmarks, dont 76,2 % sur Terminal Bench 2.1 et 1 656 ELO sur GDP Val AA. Il rivalise avec des systèmes comme GPT-5.5 et Claude Opus 4.7, tout en atteignant environ 280 tokens par seconde, soit près de quatre fois plus rapide que ses concurrents. Google le positionne comme performant et économique.

Réduction majeure des coûts pour les entreprises

Google affirme que Flash offre des capacités similaires à moins de la moitié du prix des modèles concurrents de pointe. Les grands utilisateurs pourraient économiser plus d’un milliard de dollars par an, soulignant l’importance croissante de l’efficacité à mesure que l’IA se généralise.

Introduction du modèle du monde Gemini Omni

Gemini Omni représente une avancée vers l’intelligence artificielle générale, combinant compréhension du texte, de l’audio, de l’image et de la vidéo dans un seul système. Contrairement aux générateurs classiques, il modélise la cohérence physique, permettant des rendus réalistes comme des animations précises du repliement des protéines et des scènes audiovisuelles synchronisées.

Montage et génération vidéo avancés

Omni permet un montage itératif piloté par conversation, où les scènes conservent continuité, physique et cohérence des personnages. Les démonstrations incluaient la transformation d’objets, la modification d’environnements et la génération de séquences multimédias structurées avec audio et visuels cohérents.

Extension de la sécurité IA et du marquage

Tous les contenus générés incluent le watermark SynthID, désormais appliqué à plus de 100 milliards d’images et vidéos et 60 000 ans d’audio. L’adoption par des entreprises comme OpenAI, Nvidia et ElevenLabs indique une évolution vers un standard de transparence à l’échelle du secteur.

Infrastructure TPU de nouvelle génération

Google a dévoilé des TPU de huitième génération, dont TPU8T pour l’entraînement et TPU8 pour l’inférence. L’entraînement peut désormais s’étendre à plus d’un million de TPU, réduisant les cycles de développement de mois à semaines. L’efficacité atteint 2x de performance par watt, avec des gains importants de latence.

Investissement massif en capital

Les dépenses annuelles en capital sont estimées à 180–190 milliards de dollars, contre 31 milliards en 2022, ce qui souligne l’ampleur de l’infrastructure nécessaire pour soutenir la croissance de l’IA.

Montée des plateformes d’agents autonomes

La plateforme Antigravity 2.0 devient un écosystème complet pour créer et orchestrer des agents IA. Associés à Gemini 3.5, ces agents peuvent exécuter des workflows complexes, automatiser des tâches de développement et opérer dans divers environnements via API et SDK avec une configuration minimale.

Améliorations de l’écosystème développeur

Google AI Studio prend désormais en charge le développement d’applications full-stack, l’intégration Kotlin et le déploiement direct. Des outils comme les agents de migration Android convertissent des apps en quelques heures, tandis que WebMCP vise à standardiser les interactions des agents web avec les outils en ligne.

Gemini Spark et agents personnels

Gemini Spark introduit des agents persistants dans le cloud, actifs en continu pour gérer des tâches comme la planification, la recherche et la communication. Il s’intègre aux services Google et à des outils tiers, illustrant le passage vers des assistants numériques toujours actifs.

IA intégrée aux produits grand public

Les nouveautés incluent Docs Live pour la création de documents à la voix, Ask YouTube pour naviguer dans les vidéos avec contexte, Daily Brief pour des résumés personnalisés, et des interactions enrichies dans Google Maps. La recherche évolue vers une interface dynamique orientée tâches avec des sorties interactives.

Nouvelles initiatives créatives et matérielles

Des outils comme Google Pix permettent l’édition d’images au niveau des objets, tandis que des lunettes alimentées par l’IA—développées avec Warby Parker et Gentle Monster—offrent assistance en temps réel, traduction et capture multimédia dans des appareils portables.

CONCLUSION

Les annonces de Google montrent un basculement vers des modèles rapides, économiques et des agents autonomes intégrés partout, marquant le passage d’outils passifs à des systèmes capables d’exécuter activement des tâches.

Transcription complète

Sur le même sujet : IA