À chaque sortie de modèle, les éditeurs de modèles d’IA brandissent des scores de benchmarks, toujours plus élevés. Mais ces évaluations sont de plus en plus contestées par la communauté scientifique, ainsi que par leurs créateurs eux-mêmes.

À chaque sortie de modèle, les éditeurs de modèles d’IA brandissent des scores de benchmarks, toujours plus élevés. Mais ces évaluations sont de plus en plus contestées par la communauté scientifique, ainsi que par leurs créateurs eux-mêmes.
