Paradigme d'entraînement ML où le modèle est mis à jour continuellement à partir de chaque nouveau exemple (ou petit batch) au fur et à mesure qu'il arrive, sans necessité de réentraîner sur l'ensemble du dataset. Contrairement au batch learning où le modèle est figé entre deux réentraînements, l'online learning s'adapte en temps réel aux changements de distribution (concept drift). Algorithmes classiques : SGD (Stochastic Gradient Descent), Perceptron, Vowpal Wabbit, River (librairie Python dédiée). Défis : catastrophic forgetting (le modèle oublie les anciens patterns en apprenant les nouveaux), stabilité (une donnée erronée peut dégrader rapidement le modèle), et évaluation (pas de dataset de test stable). Utilisé pour la personnalisation en temps réel (systèmes de recommandation), le pricing dynamique et la détection de fraude.