Accueil›Outils›Feast

Feast

ML Platform

Le feature store open source pour servir des features ML temps réel depuis votre data warehouse

Tarif

Gratuit (open source). Tecton propose une version enterprise managée.

Open sourceFree tierAvancé

Présentation

Feast (Feature Store) est le feature store open source de référence pour le ML en production. Il découple la création des features (batch, streaming) de leur service à l'inférence. Feast gère le stockage offline (BigQuery, Redshift) pour l'entraînement et le stockage online (Redis, DynamoDB) pour l'inférence bas-latence. La définition des features est centralisée et versionnée.

Fonctionnalités clés

✓Registry de features centralisé

✓Feature Views pour la définition des features

✓Online store (Redis, DynamoDB) pour l'inférence

✓Offline store (BigQuery, Redshift, Snowflake)

✓Point-in-time correct joins pour l'entraînement

✓Matérialisation batch et streaming

✓SDK Python pour le serving et l'entraînement

✓Intégration avec MLflow, Ray, PyTorch

Cas d'usage

Feature store partagé entre 10 modèles

Feast centralise 200 features (comportementales, transactionnelles, démographiques). Chaque data scientist récupère les features via get_online_features() pour l'inférence et get_historical_features() pour l'entraînement.

✓ Points forts

+Séparation propre entre la définition et le serving des features

+Point-in-time correct : évite le data leakage dans les datasets d'entraînement

+Online/offline store pour les deux cas d'usage ML

+Gratuit et self-hostable

✗ Limites

−Complexité d'installation et de maintenance

−La matérialisation (copie vers l'online store) doit être planifiée

−Moins de fonctionnalités enterprise que Tecton

⚠️ Pièges connus en production

1.La matérialisation vers le online store Redis doit être automatisée (Airflow, Dagster) — sans refresh régulier, les features sont stale.

2.L'absence de TTL sur le online store peut faire grossir Redis indéfiniment — configurer des politiques d'expiration.

✓ Fait pour vous si…

Équipes ML avec de nombreux modèles en production ayant besoin de features partagées entre entraînement et inférence temps réel.

✗ Pas fait pour vous si…

Équipes avec peu de modèles ou des pipelines ML simples sans besoin de partage de features.

feature-storemlopen-sourceproductionmlops