Nouveau benchmark montre que Claude Mythos et GPT-5.5 peuvent développer des exploits de navigateur autonomes
9/10Des chercheurs de Carnegie Mellon ont établi une référence démontrant que Claude Mythos d'Anthropic et GPT-5.5 sont capables de créer de manière autonome de véritables vulnérabilités dans le moteur V8 de Google. Claude Mythos se démarque par ses performances supérieures, bien que cela implique un coût plus élevé, soulignant ses capacités avancées en hacking IA.
