
Tech • IA • Crypto
Hermes 2.0 introduit une orchestration avancée d’agents IA, mais sa véritable puissance dépend d’une configuration approfondie et de son intégration avec des modèles externes comme Claude et MiniMax, plutôt que d’une utilisation prête à l’emploi.
Hermes 2.0 est présenté comme un système IA haute performance capable d’orchestrer plusieurs modèles de langage, outils et workflows dans une interface unique. Plutôt qu’une intelligence autonome, il agit comme une couche d’intégration reliant modèles, mémoire, outils et logique d’automatisation en une architecture unifiée. Ce positionnement reflète une évolution vers des systèmes IA modulaires plutôt que des modèles monolithiques.
Une faiblesse majeure d’Hermes est l’absence de contrôle complet du navigateur, l’empêchant d’effectuer des tâches comme naviguer sur des sites ou extraire des données depuis des images. Cette limite devient importante dans des cas concrets comme l’analyse d’images de diagnostic de performance énergétique (DPE). Pour y remédier, l’intégration avec Claude, qui inclut un navigateur basé sur Chromium, permet une interaction web complète et le traitement visuel.
Hermes permet désormais un accès direct via terminal à Claude 4.8 Code, donnant aux utilisateurs la possibilité de déléguer des tâches complexes de navigation et d’exécution. Claude peut naviguer de manière autonome, extraire des données structurées et exécuter des workflows sans intervention. Cette configuration hybride combine l’orchestration d’Hermes avec la couche d’exécution de Claude.
Malgré des promesses d’autonomie, Hermes ne fonctionne pas efficacement sans configuration manuelle. Beaucoup d’utilisateurs échouent en se contentant d’installer le système et de connecter un modèle. Le problème central est l’absence par défaut d’un fichier de prompt système (Sys.md), qui doit être créé et rempli pour définir le comportement, la mémoire et l’accès aux outils.
Le fichier Sys.md détermine le fonctionnement d’Hermes, notamment où la mémoire est stockée, quels outils sont disponibles et comment les décisions sont prises. Sans lui, le système manque de logique opérationnelle. Une bonne configuration transforme Hermes d’une coquille vide en un agent structuré capable d’exécuter des tâches de manière fiable.
Hermes s’appuie sur des connexions Model Context Protocol (MCP) pour interagir avec des services externes comme Airtable et Notion. Ces intégrations peuvent être configurées via clés API ou OAuth, ce dernier étant plus simple. Une fois connecté, Hermes peut automatiser des workflows comme la mise à jour de CRM ou la gestion de bases de connaissances.
Créer des agents IA efficaces ne se limite pas au prompt. Les systèmes fonctionnels exigent des architectures structurées avec des configurations YAML, des scripts, des déclencheurs et une logique de validation. Des instructions simples comme « agir comme un expert » sont insuffisantes, surtout pour des tâches complexes impliquant plusieurs types de données ou outils.
Un workflow typique consiste à extraire des emails tagués « partenariat » depuis Gmail, analyser les données pertinentes, puis les envoyer vers Airtable avec un suivi de statut. Le système peut aussi générer et envoyer des réponses automatiquement via des modèles prédéfinis. Ces პროცეს peuvent être planifiés via une automatisation de type cron.
Hermes prend en charge plusieurs fournisseurs simultanément, dont MiniMax, Claude, ChatGPT et Ollama. Les écarts de coût sont importants: MiniMax peut être jusqu’à 10 fois moins cher que Claude et 5 fois moins cher qu’OpenAI, tout en offrant des performances comparables grâce à un entraînement basé sur des systèmes de type Claude.
Les utilisateurs soucieux de la confidentialité peuvent choisir Ollama, qui exécute les modèles sans entraîner sur les données utilisateur mais avec un coût de calcul plus élevé. À l’inverse, les fournisseurs cloud offrent scalabilité et prix plus bas, au prix d’une plus grande exposition des données.
Hermes peut être utilisé gratuitement en exécutant des modèles locaux via LM Studio. Des modèles comme Gemma 4 peuvent fonctionner sur du matériel grand public, avec des besoins allant de 3B à 12B de paramètres selon la VRAM disponible. Cette configuration permet un traitement hors ligne et un contrôle total des données.
Hermes permet de lancer plusieurs agents simultanément, facilitant l’exécution parallèle de tâches. Une nouvelle interface permet de surveiller ces agents en temps réel via des fenêtres flottantes, améliorant la transparence et le multitâche.
Hermes 2.0 illustre l’évolution de l’IA vers des systèmes d’agents orchestrés, où l’efficacité repose moins sur la puissance brute des modèles que sur une configuration structurée, l’intégration d’outils et la collaboration entre plusieurs modèles.