ENFR
8news

Tech • IA • Crypto

Aujourd'huiMa veilleVidéosTop articles 24hArchivesFavorisMes topics

GPT-5.5 Instant, OpenAI Realtime et guerre entreprise IA

IAvendredi 8 mai 2026· 12 vidéos

Briefing

Lecteur audio
0:00 / 0:00

GPT-5.5 Instant remplace 5.3

OpenAI déploie GPT-5.5 Instant comme nouveau modèle par défaut, succédant à GPT-5.3 Instant sans passer par une version 5.4. Conçu pour couvrir 95 % des usages, il privilégie vitesse et réponses concises. L’éditeur annonce une réduction de 50 % des hallucinations, améliorant la fiabilité factuelle. Une période de transition permet encore d’utiliser l’ancien modèle pendant environ trois mois.

OpenAI Realtime traduit 70 langues

OpenAI introduit GPT Realtime Translate et GPT Realtime 2, capables de traiter la voix en continu. La traduction couvre environ 70 langues avec un rendu fluide en cours de phrase. Le système gère interruptions, changements de langue et ton conversationnel en temps réel. Les performances atteignent 96,6 % sur Big Bench Audio, avec un contexte jusqu’à 128 000 tokens.

OpenAI vs Anthropic en entreprise

OpenAI lance The Deployment Company tandis qu’Anthropic crée Enterprise Services pour capter le marché B2B. Les deux acteurs s’appuient sur des cabinets de conseil pour intégrer l’IA à grande échelle. L’enjeu se déplace du modèle vers le déploiement opérationnel, la conformité et le support. Cette course vise les grands comptes et des contrats longue durée.

Graphify explose sur GitHub

Graphify dépasse 500 000 téléchargements et environ 43 000 étoiles GitHub en quelques semaines. L’outil transforme code et documents en graphes de connaissances persistants. Cette approche neuro-symbolique réduit l’usage de tokens et améliore la mémoire des systèmes. Les cas d’usage incluent la cartographie de code et l’onboarding automatisé.

DeepSeek TUI cartonne terminal

DeepSeek TUI, basé sur DeepSeek V4, dépasse 10 200 étoiles GitHub avec une croissance virale. L’agent opère directement dans le terminal pour lire, modifier et exécuter du code. Il exploite une fenêtre de 1 million de tokens avec modes Pro et Flash. Ce positionnement natif développeur renforce son adoption rapide.

Cortex automatise Chrome en direct

Cortex lance une extension utilisant les sessions réelles Chrome avec cookies et comptes actifs. L’agent navigue, extrait et exécute des tâches dans des onglets dédiés sans perturber l’utilisateur. Il comble les limites des plugins en accédant à des interfaces web complètes. L’automatisation parallèle permet des workflows continus en arrière-plan.

Google Fitbit R et Gemini santé

Google dévoile le wearable sans écran Fitbit R avec jusqu’à 7 jours d’autonomie. L’appareil alimente Google Health, une plateforme unifiée dopée à Gemini. Un coach IA analyse rythme cardiaque, sommeil et activité pour fournir des recommandations prédictives. Le modèle évolue vers des abonnements santé IA personnalisés.

RAG dépasse Obsidian mémoire

Obsidian reste une base Markdown mais n’est pas un système RAG. Les pipelines RAG reposent sur des bases vectorielles et des embeddings pour extraire seulement l’information pertinente. Envoyer trop de contexte aux modèles comme Claude ou ChatGPT dégrade performances et coûts. Une architecture bien conçue évite la saturation et améliore la précision.

Vidéos couvertes

Briefings précédents · IA