ENFR

Tech • IA • Crypto

Aujourd'hui Shorts À la une Topics Toutes les vidéos Chaînes YT Crypto Archives Favoris

La nouvelle IA chinoise est 6 fois plus efficace que Claude

7/10

IAAI Revolution17 juin 2026 à 23:4215:51

Lecteur audio

0:00 / 0:00

INTRO

De nouveaux modèles de code à poids ouverts en provenance de Chine cassent les prix des principaux systèmes d’IA tout en égalant ou dépassant leurs performances sur plusieurs benchmarks, intensifiant la concurrence sur toute la pile IA.

POINTS CLÉS

Kimi K2.7 Code cible les workflows d’agents

Moonshot AI a publié Kimi K2.7 Code, un modèle mixture-of-experts d’1 trillion de paramètres optimisé pour des agents de codage plutôt qu’un usage général. Il active 32 milliards de paramètres par token via 384 experts, offrant des performances à grande échelle avec une efficacité pratique. Le modèle est conçu pour des tâches de développement multi‑étapes comme la navigation dans des dépôts, le débogage, les tests et l’itération sur plusieurs sessions.

Des gains d’efficacité réduisent les coûts réels

Le modèle utiliserait 30 % de “thinking tokens” en moins que son prédécesseur, réduisant latence et coûts dans les workflows itératifs. Des fonctions comme forced thinking et preserved reasoning lui permettent de conserver le contexte sur plusieurs étapes, essentiel pour des agents autonomes sur des tâches longues.

Benchmarks compétitifs avec des écarts notables

K2.7 Code progresse nettement, atteignant 62,0 sur Kimiko Bench V2 et 53,6 sur Program Bench, mais reste derrière GPT-5.5 (69,1 sur Program Bench). Il dépasse toutefois Claude Opus 4.8 sur MCP Mark Verified (81,1 vs 76,4), un test reflétant des environnements réels (GitHub, bases de données).

Une tarification agressive rebat les cartes

Kimi K2.7 Code coûte 0,95 $ / million de tokens en entrée et 4 $ en sortie, contre GPT-5.5 (5/30) et Claude Opus 4.8 (5/25). L’entrée mise en cache tombe à 0,19 $, rendant les workflows répétés bien moins chers. Le prix de sortie est clé, car les agents de code génèrent de gros volumes.

GLM 5.2 pousse l’ingénierie long contexte

Z.ai a lancé GLM 5.2, un modèle open-weight de 753 milliards de paramètres axé sur des tâches de code de longue durée. Il gère un contexte de 1 million de tokens et introduit des optimisations comme le partage d’index, réduisant le coût de calcul jusqu’à 2,9× au maximum.

Des victoires sur GPT-5.5 en benchmark

GLM 5.2 dépasse GPT-5.5 sur plusieurs tests majeurs, dont SWE-Bench Pro (62,1 vs 58,6) et Frontier SWE (74,4 % vs 72,6 %), tout en restant compétitif face à Claude Opus 4.8. Il obtient aussi de meilleurs scores en raisonnement avec outils, signe de solidité sur des scénarios complexes multi‑étapes.

Prix bas avec accès ouvert complet

Proposé à 1,40 $ en entrée / 4,40 $ en sortie par million de tokens, GLM 5.2 coûte environ un sixième de GPT-5.5. Il est publié sous licence MIT permissive, permettant aux entreprises de l’exécuter, l’ajuster et le déployer sans dépendance fournisseur ni contraintes géopolitiques.

La géopolitique renforce l’attrait des modèles ouverts

De récents contrôles à l’export ont retiré certains modèles avancés à l’échelle mondiale, soulevant des inquiétudes sur la stabilité d’accès. Des alternatives open-weight comme GLM 5.2 offrent une indépendance opérationnelle, assurant la continuité malgré les changements de politique.

L’acquisition de Cursor souligne la valeur stratégique des outils de code

Des rapports indiquent que SpaceX pourrait acquérir AnySphere (Cursor) dans une opération en actions d’environ 60 milliards de dollars. Cursor a atteint un run rate annualisé de 4 milliards de dollars, soit une croissance rapide et environ 21 % du chiffre d’affaires 2025 de SpaceX.

Le calcul et les données comme moteurs clés

L’intégration à des infrastructures massives, incluant un accès rapporté à des centaines de milliers de GPU, pourrait accélérer les capacités de Cursor. La plateforme génère aussi des données précieuses sur les workflows réels de code, utiles pour améliorer les systèmes d’IA.

OpenAI prépare un modèle vocal de nouvelle génération

OpenAI développe GPT-BD1, un système vocal bidirectionnel conçu pour des conversations plus naturelles. Il devrait permettre écoute et parole simultanées, des interruptions plus fluides et des niveaux de raisonnement ajustables, corrigeant des limites actuelles.

CONCLUSION

Les modèles open-weight comblent rapidement l’écart avec les systèmes propriétaires en performance et en coût, tandis que les avancées en infrastructure et interfaces accentuent la concurrence dans tout l’écosystème IA.

Transcription complète

Sur le même sujet : IA