L'impact silencieux des backends d'inférence sur la reproductibilité des grands modèles linguistiques
9/10Cette étude montre que la sélection et la configuration des backends d'inférence affectent fortement la reproductibilité des résultats des LLMs, un hyperparamètre souvent négligé. Elle analyse les différences de performance et de cohérence selon les frameworks et offres cloud, soulignant la nécessité d'une standardisation pour des benchmarks fiables.
