
Tech • IA • Crypto
Une vague de développements rapides en IA inclut une application assistant Google brièvement publiée, des indices d’un modèle vidéo Gemini unifié, des avancées en IA médicale, de nouveaux outils pour développeurs et une concurrence croissante sur les modèles à poids ouverts.
Google a brièvement publié une application Android expérimentale appelée Cosmo, puis l’a retirée en quelques heures. L’app combinait Gemini Nano en local, du traitement cloud et un mode hybride basculant dynamiquement. Elle utilisait aussi les API d’accessibilité d’Android pour lire le contexte à l’écran, suggérant un assistant très intégré. Les premiers tests ont montré des fonctionnalités incomplètes et une présentation rudimentaire, indiquant une sortie prématurée.
L’architecture de Cosmo signale un virage vers des systèmes IA mêlant appareil et cloud. Les tâches légères s’exécutent localement pour la vitesse et la confidentialité, tandis que les requêtes complexes sont déportées vers des serveurs. Cette approche pourrait définir les futurs assistants en équilibrant performance, coût et sensibilité des données.
Des fuites évoquent un système Gemini “Omni” lié à la génération vidéo. Contrairement à la séparation actuelle entre Veo (vidéo) et Nano Banana (images), Omni pourrait unifier la génération média. Sa présence dans des interfaces suggère un déploiement en cours, possiblement lié à Google I/O 2026. Cela intervient dans un contexte de forte concurrence en vidéo IA.
Google DeepMind a présenté un système de recherche conçu pour assister les médecins. L’IA aide à la prise de notes, à la recherche et aux interactions patients sous supervision. Lors des tests, elle a produit zéro erreur critique dans 97 cas sur 98 et a surpassé certains outils médicaux existants.
Basé sur Gemini et Project Astra, le système peut voir, entendre et répondre lors de consultations vidéo. Il a guidé des patients dans des vérifications physiques (inhalateur, mobilité de l’épaule). Les médecins humains restent toutefois meilleurs pour détecter des pathologies graves, confirmant son rôle d’assistance.
Un système à double agent ajoute une supervision: une IA interagit avec le patient, une autre vérifie la conformité sécurité. Le système est limité à des essais dans des pays comme les États-Unis, l’Inde et Singapour, sans autorisation pour diagnostic ou traitement.
Codex d’OpenAI introduit des “animaux” pixelisés affichant l’avancement des tâches et permettant d’interagir. Ludique mais aussi interface légère de communication. Les utilisateurs peuvent créer des animaux personnalisés via des images.
Codex importe désormais des configurations d’autres outils, réduisant les frictions. Ajouts: dictionnaires de dictée vocale personnalisables et meilleure automatisation, positionnant Codex comme une couche desktop IA plus large.
Anthropic testerait un modèle nommé Jupiter, suivant ses schémas internes avant lancement. Ces tests s’alignent avec sa stratégie axée sécurité et pourraient précéder une annonce lors d’un événement développeur. Mise à jour possible de Claude 4.7 ou nouvelle génération.
Mistral Medium 3.5, modèle 128B paramètres, offre de solides capacités techniques et une architecture unifiée. Mais son prix—1,50 $/million tokens en entrée et 7,50 $ en sortie—a suscité des critiques face à des alternatives moins chères.
Des modèles comme Qwen 3.6 offrent des performances comparables à moindre coût avec licences permissives. Les modèles ouverts chinois dominent de plus en plus benchmarks et adoption.
Malgré les critiques, Mistral reste clé comme option européenne, auto-hébergeable et conforme RGPD. Cela attire les secteurs régulés, avec des entreprises comme HSBC déjà engagées.
Le paysage de l’IA se fragmente rapidement entre assistants hybrides, systèmes multimodaux et stratégies régionales, avec une concurrence accrue sur la performance et la flexibilité de déploiement.