Data Universe
Newsletter
Accueil/Encyclopédie/Feature Store
🏪Machine LearningAvancéMLOps

Feature Store

Référentiel centralisé pour stocker, calculer, versioner et servir des features ML, garantissant la cohérence entre l'entraînement et la production.

💡Explication simple

Chaque équipe ML recalcule les mêmes features (transactions_30j, score_rfm, nb_incidents_paiement) de son côté, avec des définitions légèrement différentes. Quand le modèle passe en production, la feature calculée en temps réel est différente de celle utilisée pour l'entraînement. Feature Store résout ça : une seule définition, une seule implémentation, consommable par n'importe quelle équipe et garantissant que la feature de prod = la feature d'entraînement.

🏗️Exemple concret

Banque avec 20 modèles ML : sans Feature Store, 20 fois le même calcul 'ratio_endettement_30j' avec 20 définitions légèrement différentes. Avec Databricks Feature Store : 1 définition officielle, calculée une fois, accessible par tous. Le modèle accède à la feature par nom ('ratio_endettement_30j') en entraînement ET en production — zéro risque de training/serving skew.

∑ Concept clé

Training : model.fit(feature_store.get_historical_features(['ratio_endettement_30j', 'score_rfm'], start_date, end_date)). Serving : feature_store.get_online_features(['ratio_endettement_30j'], entity_ids=[client_id]).

🎯Quand l'utiliser ?

Plusieurs modèles ML réutilisant les mêmes features
Éliminer le training/serving skew en production
Centraliser et documenter les features ML d'une organisation

✅ Avantages

+Élimination du training/serving skew (source principale d'erreurs ML production)
+Réutilisabilité : une feature développée une fois utilisée par 10 modèles
+Documentation et découvrabilité des features

⚠️ Limites

Infrastructure supplémentaire à maintenir (store online + offline)
Adoption nécessite un changement de pratiques des équipes
Latence de la couche online à surveiller

🛠️ Outils principaux

Databricks Feature Store
Feast (open source)
Hopsworks
AWS SageMaker Feature Store
Vertex AI Feature Store
MLOpsMLFeature EngineeringProductionCohérence

Concepts liés

🔭

ACP / PCA (Analyse en Composantes Principales)

Apprentissage non supervisé

🤖

Agent IA — Intelligence artificielle autonome

IA Générative

😊

Analyse de sentiment (NLP)

NLP

🌳

Arbre de décision

Apprentissage supervisé

← Retour à l'encyclopédie