Data Universe
Newsletter
AccueilOutilsFeast
🍽️

Feast

ML Platform

Le feature store open source pour servir des features ML temps réel depuis votre data warehouse

Tarif

Gratuit (open source). Tecton propose une version enterprise managée.

Open sourceFree tierAvancé

Feast (Feature Store) est le feature store open source de référence pour le ML en production. Il découple la création des features (batch, streaming) de leur service à l'inférence. Feast gère le stockage offline (BigQuery, Redshift) pour l'entraînement et le stockage online (Redis, DynamoDB) pour l'inférence bas-latence. La définition des features est centralisée et versionnée.

Registry de features centralisé
Feature Views pour la définition des features
Online store (Redis, DynamoDB) pour l'inférence
Offline store (BigQuery, Redshift, Snowflake)
Point-in-time correct joins pour l'entraînement
Matérialisation batch et streaming
SDK Python pour le serving et l'entraînement
Intégration avec MLflow, Ray, PyTorch
1

Feature store partagé entre 10 modèles

Feast centralise 200 features (comportementales, transactionnelles, démographiques). Chaque data scientist récupère les features via get_online_features() pour l'inférence et get_historical_features() pour l'entraînement.

✓ Points forts

+Séparation propre entre la définition et le serving des features
+Point-in-time correct : évite le data leakage dans les datasets d'entraînement
+Online/offline store pour les deux cas d'usage ML
+Gratuit et self-hostable

✗ Limites

Complexité d'installation et de maintenance
La matérialisation (copie vers l'online store) doit être planifiée
Moins de fonctionnalités enterprise que Tecton

⚠️ Pièges connus en production

1.La matérialisation vers le online store Redis doit être automatisée (Airflow, Dagster) — sans refresh régulier, les features sont stale.
2.L'absence de TTL sur le online store peut faire grossir Redis indéfiniment — configurer des politiques d'expiration.

✓ Fait pour vous si…

Équipes ML avec de nombreux modèles en production ayant besoin de features partagées entre entraînement et inférence temps réel.

✗ Pas fait pour vous si…

Équipes avec peu de modèles ou des pipelines ML simples sans besoin de partage de features.

feature-storemlopen-sourceproductionmlops