Paramètre qui contrôle le degré d'aléatoire dans le processus d'échantillonnage des tokens lors de la génération. Techniquement, il divise les logits (scores bruts) avant d'appliquer softmax : une temperature basse (proche de 0) amplifie les écarts et rend le token le plus probable quasi-certain (comportement déterministe), tandis qu'une temperature haute (>1) aplatit la distribution et augmente la diversité. Une temperature à 0 donne des résultats reproductibles, idéal pour la génération de code ou l'extraction structurée. Une temperature à 0.7-1.0 favorise la créativité pour la rédaction ou le brainstorming. Il existe d'autres paramètres de sampling complémentaires : top-p (nucleus sampling) et top-k.