ENFR

Tech • IA • Crypto

Aujourd'hui Topics Vidéos Crypto Archives Favoris

Agents gérés dans l’API Gemini

8/10

GoogleGoogle for Developers3 juin 2026 à 17:129:35

Lecteur audio

0:00 / 0:00

INTRO

Google a introduit des agents gérés dans l’API Gemini, permettant aux développeurs de déployer des agents d’IA autonomes avec un seul appel, dans un environnement sécurisé et isolé.

POINTS CLÉS

Agents autonomes en un seul appel

La nouvelle capacité d’agents gérés permet aux développeurs d’invoquer un agent autonome avec un seul appel API. Ces agents peuvent exécuter indépendamment des tâches complexes comme écrire du code, lancer des commandes et orchestrer des workflows. L’objectif est de simplifier l’accès à des comportements avancés qui nécessitaient auparavant un important effort d’ingénierie.

Environnement d’exécution Linux isolé

Chaque agent fonctionne dans un sandbox Linux distant et isolé, où il peut exécuter du code en toute sécurité, créer des fichiers et lancer des commandes shell. Cette conception évite d’exposer les systèmes de production au code généré par l’IA, réduisant les risques tout en permettant une automatisation puissante.

Propulsé par Gemini 3.5 Flash et Anti-Gravity

Le système repose initialement sur Gemini 3.5 Flash ainsi que sur un nouveau framework d’agents Anti-Gravity, qui sert de base à l’orchestration. Ce même framework soutient aussi des outils de développement comme l’IDE Anti-Gravity, assurant une cohérence entre environnements.

Agents personnalisables et réutilisables

Les développeurs peuvent créer des agents gérés sur mesure en définissant des instructions système, en ajoutant des “compétences” spécialisées et en les empaquetant pour réutilisation. Ces agents peuvent être déployés en interne ou proposés à des clients, couvrant des cas d’usage allant de l’automatisation interne à des applications complètes.

Intégration via l’Interactions API

Les agents gérés sont accessibles via l’Interactions API, une interface plus récente conçue pour unifier la communication avec les modèles et les agents. Elle remplace les approches centrées uniquement sur la génération de contenu, marquant un passage vers des workflows multi-étapes pilotés par des outils.

Des prompts simples aux workflows multi-étapes

Contrairement aux API de chat traditionnelles, le nouveau système prend en charge des flux d’actions continus plutôt que des échanges tour par tour. Les agents peuvent enchaîner des étapes comme des appels d’outils, la délégation à des sous-agents et des chaînes de raisonnement avant de renvoyer un résultat.

Outils intégrés et support natif de l’environnement

Les outils, environnements d’exécution et étapes intermédiaires sont des éléments de premier plan dans l’API. Cela permet aux agents d’intégrer facilement des capacités comme l’appel de fonctions, la génération de fichiers et l’usage d’outils externes sans infrastructure personnalisée.

Démo: génération automatisée d’émission radio

Une application de démonstration a montré un agent transformant des discussions tendances en un programme radio de trois minutes. Il agrège des sources, génère un script, produit des segments audio et crée même de la musique avec Lyria, illustrant la coordination de multiples capacités IA dans un seul workflow.

Expérience développeur centrée sur les agents

La plateforme introduit une approche “agent-native”, où les agents peuvent être définis avec de simples fichiers Markdown. Les développeurs spécifient le comportement dans un fichier agents.md et définissent les compétences de façon similaire, rendant la création plus accessible.

Documentation optimisée pour l’usage par l’IA

La documentation a été repensée pour être lisible par machine et facilement exploitable par des agents. Des fonctionnalités comme des docs Markdown consultables et des outils d’intégration dédiés permettent aux agents de codage de comprendre et d’implémenter l’API plus efficacement.

Adoption flexible pour les développeurs

Les développeurs peuvent choisir entre des agents entièrement gérés ou continuer à utiliser des modèles bruts avec leurs propres frameworks. Cette flexibilité permet une adoption progressive, adaptée aux applications simples comme aux systèmes avancés pilotés par agents.

CONCLUSION

Les agents gérés dans l’API Gemini marquent une évolution vers des systèmes d’IA autonomes capables d’utiliser des outils, combinant simplicité d’usage et puissance d’exécution dans un environnement sécurisé.

Transcription complète

Sur le même sujet : Google