Perplexity sert les modèles Qwen3 235B sur racks Nvidia GB200, montrant des gains d'inférence majeurs
8/10Perplexity utilise les modèles Qwen3 235 milliards de paramètres sur des racks Nvidia GB200, démontrant des améliorations significatives en termes de vitesse et d'efficacité d'inférence. Cette avancée a été rapportée en mai 2026, indiquant une optimisation matérielle clé dans le domaine des grands modèles de langage.
