Data Universe
Newsletter
GlossaireDDatabricks
Infrastructure

Databricks

Définition

Plateforme unifiée de data engineering, data science et ML fondée par les créateurs d'Apache Spark. Son concept central est le Lakehouse : stocker les données en Delta Lake sur le cloud object storage tout en offrant les performances analytiques d'un warehouse. L'environnement de notebooks collaboratifs, l'intégration native de MLflow et Spark, et le Unity Catalog (gouvernance unifiée des données et des modèles) en font une plateforme end-to-end pour les équipes data. Delta Live Tables automatise la construction de pipelines de données avec qualité intégrée. Databricks est en compétition directe avec Snowflake (qui riposte avec Snowpark) sur le marché du lakehouse.

Exemples concrets

Databricks RuntimeDelta Live TablesMLflow intégréUnity Catalog
← Retour au glossaireTermes en “D

Fiche rapide

CatégorieInfrastructure
Exemples4 outils / technologies