🔍Machine LearningAvancéMLOps

Feature Store

Référentiel centralisé pour stocker, calculer, versioner et servir des features ML, garantissant la cohérence entre l'entraînement et la production.

💡Explication simple

Chaque équipe ML recalcule les mêmes features (transactions_30j, score_rfm, nb_incidents_paiement) de son côté, avec des définitions légèrement différentes. Quand le modèle passe en production, la feature calculée en temps réel est différente de celle utilisée pour l'entraînement. Feature Store résout ça : une seule définition, une seule implémentation, consommable par n'importe quelle équipe et garantissant que la feature de prod = la feature d'entraînement.

🏗️Exemple concret

Banque avec 20 modèles ML : sans Feature Store, 20 fois le même calcul 'ratio_endettement_30j' avec 20 définitions légèrement différentes. Avec Databricks Feature Store : 1 définition officielle, calculée une fois, accessible par tous. Le modèle accède à la feature par nom ('ratio_endettement_30j') en entraînement ET en production — zéro risque de training/serving skew.

∑ Concept clé

Training : model.fit(feature_store.get_historical_features(['ratio_endettement_30j', 'score_rfm'], start_date, end_date)). Serving : feature_store.get_online_features(['ratio_endettement_30j'], entity_ids=[client_id]).