
Tech • IA • Crypto
De nouveaux modèles de code à poids ouverts en provenance de Chine cassent les prix des principaux systèmes d’IA tout en égalant ou dépassant leurs performances sur plusieurs benchmarks, intensifiant la concurrence sur toute la pile IA.
Moonshot AI a publié Kimi K2.7 Code, un modèle mixture-of-experts d’1 trillion de paramètres optimisé pour des agents de codage plutôt qu’un usage général. Il active 32 milliards de paramètres par token via 384 experts, offrant des performances à grande échelle avec une efficacité pratique. Le modèle est conçu pour des tâches de développement multi‑étapes comme la navigation dans des dépôts, le débogage, les tests et l’itération sur plusieurs sessions.
Le modèle utiliserait 30 % de “thinking tokens” en moins que son prédécesseur, réduisant latence et coûts dans les workflows itératifs. Des fonctions comme forced thinking et preserved reasoning lui permettent de conserver le contexte sur plusieurs étapes, essentiel pour des agents autonomes sur des tâches longues.
K2.7 Code progresse nettement, atteignant 62,0 sur Kimiko Bench V2 et 53,6 sur Program Bench, mais reste derrière GPT-5.5 (69,1 sur Program Bench). Il dépasse toutefois Claude Opus 4.8 sur MCP Mark Verified (81,1 vs 76,4), un test reflétant des environnements réels (GitHub, bases de données).
Kimi K2.7 Code coûte 0,95 $ / million de tokens en entrée et 4 $ en sortie, contre GPT-5.5 (5/30) et Claude Opus 4.8 (5/25). L’entrée mise en cache tombe à 0,19 $, rendant les workflows répétés bien moins chers. Le prix de sortie est clé, car les agents de code génèrent de gros volumes.
Z.ai a lancé GLM 5.2, un modèle open-weight de 753 milliards de paramètres axé sur des tâches de code de longue durée. Il gère un contexte de 1 million de tokens et introduit des optimisations comme le partage d’index, réduisant le coût de calcul jusqu’à 2,9× au maximum.
GLM 5.2 dépasse GPT-5.5 sur plusieurs tests majeurs, dont SWE-Bench Pro (62,1 vs 58,6) et Frontier SWE (74,4 % vs 72,6 %), tout en restant compétitif face à Claude Opus 4.8. Il obtient aussi de meilleurs scores en raisonnement avec outils, signe de solidité sur des scénarios complexes multi‑étapes.
Proposé à 1,40 $ en entrée / 4,40 $ en sortie par million de tokens, GLM 5.2 coûte environ un sixième de GPT-5.5. Il est publié sous licence MIT permissive, permettant aux entreprises de l’exécuter, l’ajuster et le déployer sans dépendance fournisseur ni contraintes géopolitiques.
De récents contrôles à l’export ont retiré certains modèles avancés à l’échelle mondiale, soulevant des inquiétudes sur la stabilité d’accès. Des alternatives open-weight comme GLM 5.2 offrent une indépendance opérationnelle, assurant la continuité malgré les changements de politique.
Des rapports indiquent que SpaceX pourrait acquérir AnySphere (Cursor) dans une opération en actions d’environ 60 milliards de dollars. Cursor a atteint un run rate annualisé de 4 milliards de dollars, soit une croissance rapide et environ 21 % du chiffre d’affaires 2025 de SpaceX.
L’intégration à des infrastructures massives, incluant un accès rapporté à des centaines de milliers de GPU, pourrait accélérer les capacités de Cursor. La plateforme génère aussi des données précieuses sur les workflows réels de code, utiles pour améliorer les systèmes d’IA.
OpenAI développe GPT-BD1, un système vocal bidirectionnel conçu pour des conversations plus naturelles. Il devrait permettre écoute et parole simultanées, des interruptions plus fluides et des niveaux de raisonnement ajustables, corrigeant des limites actuelles.
Les modèles open-weight comblent rapidement l’écart avec les systèmes propriétaires en performance et en coût, tandis que les avancées en infrastructure et interfaces accentuent la concurrence dans tout l’écosystème IA.