ENFR

Tech • IA • Crypto

Aujourd'hui Topics Vidéos Crypto Archives Favoris

Premiers pas avec les agents gérés

8/10

GoogleGoogle for Developers2 juin 2026 à 19:0011:33

Lecteur audio

0:00 / 0:00

INTRO

Google a introduit des agents gérés dans l’API Gemini et AI Studio, permettant aux développeurs de créer des agents IA personnalisables capables d’exécuter du code, de naviguer sur le web et d’opérer dans des environnements cloud sécurisés.

POINTS CLÉS

Les agents gérés s’exécutent dans des sandboxes sécurisés

Le nouveau système permet aux agents IA d’opérer dans un sandbox Linux sécurisé hébergé par Google, où ils peuvent exécuter du code, gérer des fichiers et effectuer des tâches de manière autonome. Cet environnement isole les opérations tout en permettant des flux de travail complexes comme le scripting, le traitement de données et la génération de fichiers.

Propulsé par Gemini 3.5 Flash

Les agents sont pilotés par Gemini 3.5 Flash, un modèle optimisé pour des flux agentiques rapides. Il prend en charge le raisonnement, l’exécution multi-étapes et l’utilisation d’outils, ce qui le rend adapté au codage, à l’automatisation et à la résolution interactive de problèmes.

AI Studio offre un point d’entrée sans code

Les développeurs peuvent expérimenter rapidement via AI Studio, qui inclut désormais un onglet « Agents » avec des modèles préconstruits. Des exemples incluent des outils pour le support client, l’analyse de données et la maintenance de dépôts, permettant de lancer des tâches avec une configuration minimale.

Automatisation de bout en bout démontrée

Dans un exemple, un agent a généré un tableau de bord météo en récupérant des données en direct, en les analysant avec Python, puis en produisant une interface HTML interactive stylée avec Tailwind CSS. L’agent a géré tout le flux, de la récupération des données à la génération front-end, en une seule commande.

Exécution transparente et accès aux fichiers

Les utilisateurs peuvent observer chaque étape réalisée par l’agent, y compris l’exécution des commandes et la création de fichiers. Les sorties comme les scripts, fichiers HTML et visualisations peuvent être téléchargées directement depuis le sandbox, offrant visibilité et reproductibilité.

Comportement personnalisable via sources et compétences

Les agents peuvent être configurés via des fichiers comme agents.md et skills.md, qui définissent comportement, ton et capacités. Les développeurs peuvent aussi joindre des scripts, jeux de données ou des dépôts GitHub entiers comme sources, permettant des agents très spécialisés.

Support API pour un contrôle programmatique

L’API Gemini inclut un endpoint d’interactions conçu pour les flux agentiques. Les développeurs peuvent initialiser des agents, envoyer des tâches et maintenir des conversations multi-étapes à l’aide d’identifiants d’interaction et d’environnements persistants.

Flux multi-étapes et avec état

Les agents prennent en charge des sessions continues où les résultats d’une étape alimentent la suivante. Par exemple, après avoir généré une suite de Fibonacci, un agent peut continuer en la traçant et en enregistrant le résultat comme image dans le même environnement.

Streaming et retour en temps réel

L’API permet des réponses en streaming, permettant d’afficher les étapes intermédiaires pendant l’exécution des tâches. Cela favorise des applications plus interactives et une meilleure expérience utilisateur en temps réel.

Récupération de fichiers via API REST

Bien que le support SDK évolue encore, les développeurs peuvent récupérer les fichiers générés en appelant un endpoint REST pour télécharger un instantané du sandbox, incluant tous les éléments créés comme scripts et sorties visuelles.

Création d’agents personnalisés via API

Les développeurs peuvent créer des agents entièrement personnalisés via des appels API, en définissant modèles de base, instructions et capacités. Un exemple inclut un agent explicatif technique capable de générer des présentations avec contenu structuré et extraits de code.

CONCLUSION

Les agents gérés de Google étendent les capacités de l’écosystème Gemini en combinant exécution autonome, personnalisation et infrastructure sécurisée, en faisant un outil puissant pour créer des flux de travail et applications avancés pilotés par l’IA.

Transcription complète

Sur le même sujet : Google