💡Machine LearningAvancéIA Générative

Fine-tuning de LLM

Technique d'adaptation d'un LLM pré-entraîné à une tâche ou un domaine spécifique en le réentraînant sur un dataset ciblé, pour un coût bien inférieur à l'entraînement from scratch.

💡Explication simple

Un LLM généraliste comme GPT-4 sait tout sur tout, mais de façon superficielle. Le fine-tuning, c'est comme prendre un médecin généraliste et le spécialiser en cardiologie : on lui montre des milliers d'exemples de cas cardiaques, et il devient expert dans ce domaine précis. La connaissance générale reste, mais la spécialité est renforcée.

🏗️Exemple concret

Un assureur fine-tune Mistral-7B sur 50 000 paires (question client / réponse expert). Résultat : le modèle répond avec le vocabulaire métier de l'assurance, respecte les contraintes réglementaires, et obtient une satisfaction client de 87% vs 61% pour le modèle de base.

∑ Concept clé

LoRA (Low-Rank Adaptation) : au lieu de modifier tous les poids W, on ajoute une décomposition de bas rang —W = BA (B et A petites matrices). Réduit le nombre de paramètres entraînables de 99%.