La technique du « thermomètre » empêche un modèle d’IA d’être trop confiant quant aux mauvaises réponses
Performances du thermomètre par rapport au nombre de tâches d’entraînement. Les performances d’étalonnage du thermomètre (ECE moyen sur cinquante-sept tâches MMLU) s’améliorent…