
Tech • IA • Crypto
Les nouveaux systèmes d’IA redéfinissent la traduction, l’architecture des modèles, les risques en cybersécurité et les diagnostics médicaux, avec des implications majeures dans de nombreux secteurs.
Gemini 3.5 Live Translate permet une traduction vocale continue à faible latence dans 70 langues sans passer par l’anglais. Le système fonctionne en mode streaming, traduisant au fil de la parole plutôt qu’en attendant des pauses. Il est déjà intégré à Google Translate sur Android et iOS, rendant les conversations multilingues en temps réel accessibles gratuitement au grand public.
Le modèle adapte la sortie vocale pour correspondre au ton, au rythme et à la hauteur du locuteur sans cloner sa voix. Cela crée des interactions plus naturelles pour les appels, réunions et conversations en direct. Il est robuste au bruit et aux voix qui se chevauchent, permettant de gérer avec précision plusieurs interlocuteurs simultanés.
L’intégration dans Google Meet et les outils d’entreprise permet des réunions multilingues où chacun parle sa langue tout en recevant des traductions en temps réel. Le modèle est aussi disponible via API, facilitant son déploiement dans des services comme le VTC, le support client et les outils d’accessibilité.
Diffusion Gemma, un modèle open-weight de Google, applique des techniques de diffusion — habituellement utilisées pour les images — au texte. Au lieu de générer des tokens séquentiellement, il affine des blocs de texte entiers de façon itérative, améliorant la cohérence globale entre phrases et paragraphes.
Le modèle atteint jusqu’à 1 000 tokens par seconde sur du matériel haut de gamme, dépassant largement les modèles autoregressifs classiques. Toutefois, il reste légèrement moins performant en raisonnement que les grands modèles. Sa conception favorise un déploiement local, avec 26B de paramètres optimisés pour des machines grand public.
L’émergence de modèles textuels basés sur la diffusion suggère un futur combinant plusieurs paradigmes. La diffusion pourrait gérer la cohérence et la structure, tandis que les LLM traditionnels assureraient le raisonnement et l’usage d’outils, menant à des architectures hybrides de plus en plus complexes.
Claude Fable 5, dérivé d’un modèle interne plus avancé, introduit des garde-fous stricts. Dans des domaines sensibles comme la cybersécurité, la biologie ou la chimie, les requêtes sont redirigées vers des modèles plus sûrs. Cela alimente le débat sur la censure et la transparence, les utilisateurs ne sachant pas toujours quel modèle répond.
Les protections visent aussi à empêcher la « distillation », où des attaquants extraient des connaissances pour entraîner des modèles concurrents. Cela reflète des tensions croissantes, à la fois géopolitiques et commerciales, autour des capacités d’IA et de la propriété intellectuelle.
Un incident de cybersécurité a exposé des données d’une plateforme de communication gouvernementale après qu’un attaquant a obtenu des identifiants via ingénierie sociale, et non par intrusion technique. La fuite concernerait des centaines de milliers de messages et des dizaines de milliers de fichiers, dont des documents restreints, soulignant la vulnérabilité humaine comme principal risque.
Un système développé par l’Hôpital universitaire de Heidelberg et le DKFZ peut classifier des tumeurs cérébrales en 12 minutes, contre 12 jours en moyenne avec les méthodes traditionnelles. Entraîné sur 9 600 patients et 11 000 échantillons, il atteint jusqu’à 84 % de précision dans les 3 meilleures prédictions, et 94 % pour les cas à forte confiance.
Chaque diagnostic traditionnel peut coûter environ 400 €, tandis que l’analyse assistée par IA réduit à la fois le coût et le temps de traitement. Le système a été validé sur plusieurs jeux de données internationaux, garantissant sa robustesse au-delà de son environnement d’entraînement initial.
L’IA accélère à la fois l’innovation concrète et l’apparition de nouveaux risques, tout en démontrant un potentiel transformateur majeur dans des domaines critiques comme la santé.