Data Universe
Newsletter
GlossaireDData Lake
Infrastructure

Data Lake

Définition

Référentiel de stockage centralisé qui conserve toutes les données dans leur format brut, qu'elles soient structurées (CSV, SQL), semi-structurées (JSON, XML) ou non structurées (images, logs, vidéos). Contrairement au data warehouse, aucune transformation n'est requise à l'ingestion : le schéma est appliqué à la lecture (schema-on-read), ce qui offre une flexibilité maximale. Cette approche facilite l'exploration et les cas d'usage imprévus, mais nécessite une gouvernance rigoureuse pour éviter de devenir un « data swamp » ingérable. Les data lakes sont le socle des architectures modernes de machine learning et de big data.

Exemples concrets

AWS S3Azure Data Lake StorageGoogle Cloud Storage
← Retour au glossaireTermes en “D

Fiche rapide

CatégorieInfrastructure
Exemples3 outils / technologies