Adaptation d'un LLM pré-entraîné à une tâche ou un domaine spécifique en continuant son entraînement sur un dataset ciblé, typiquement des paires instruction/réponse. Le fine-tuning complet (full fine-tuning) ajuste tous les paramètres, ce qui est très coûteux. Des méthodes efficaces comme LoRA (Low-Rank Adaptation) n'ajoutent qu'une petite matrice de paramètres entraînables tout en gelant le modèle de base, réduisant les besoins en VRAM de 10x. Le fine-tuning est préférable au prompt engineering quand le comportement désiré est difficile à décrire en langage naturel, quand on veut inculquer un style spécifique, ou quand on a des milliers d'exemples de haute qualité.