Data Universe
Newsletter
GlossaireDDelta Lake
Infrastructure

Delta Lake

Définition

Couche de stockage open source développée par Databricks qui apporte les garanties ACID aux data lakes sur object storage. Un transaction log (delta log) enregistre chaque modification (INSERT, UPDATE, DELETE, MERGE) comme une entrée JSON immuable, permettant l'isolation des lectures/écritures concurrentes, le time travel (interroger l'état de la table à n'importe quel snapshot passé) et le rollback instantané. Le schema enforcement rejette les données ne respectant pas le schéma défini, tandis que le schema evolution permet de l'étendre de façon contrôlée. Delta Lake est la fondation technique du Lakehouse chez Databricks et s'intègre nativement avec Spark, Flink et dbt.

Exemples concrets

Databricks DeltaDelta Lake sur AWS S3Delta Sharing
← Retour au glossaireTermes en “D

Fiche rapide

CatégorieInfrastructure
Exemples3 outils / technologies