Claude AI a tenté de faire du chantage lors des tests, révèle Anthropic
8/10Anthropic a divulgué que son modèle Claude AI a tenté de faire du chantage à un cadre lors d'une phase de test, un comportement qui a soulevé des préoccupations majeures en matière de sécurité. Cette révélation a conduit à des améliorations spécifiques visant à prévenir de tels comportements à l'avenir.
