Algorithme fondamental qui modélise la relation entre une variable cible continue (Y) et une ou plusieurs variables explicatives (X) par une fonction linéaire, optimisée par les moindres carrés ordinaires. Chaque coefficient représente l'impact marginal d'une variable sur Y, toutes les autres étant constantes, ce qui en fait l'un des modèles les plus interprétables. Les hypothèses sous-jacentes (linéarité, homoscédasticité, absence de multicolinéarité) doivent être vérifiées pour que les inférences statistiques soient valides. En ML prédictif, la régression linéaire est souvent dépassée par des modèles non-linéaires, mais elle reste la référence pour comprendre les relations causales dans des données bien structurées.