Snowflake est le cloud data warehouse qui s'est imposé comme standard entre 2018 et 2024. Son architecture révolutionnaire sépare le stockage du compute, permettant une scalabilité élastique. Disponible sur AWS, Azure et GCP, il s'est imposé comme le standard pour les entreprises mid-market et enterprise en France.
Entrepôt de données centralisé
Les équipes data centralisent toutes leurs sources (ERP, CRM, marketing) dans Snowflake via des pipelines ELT, puis exposent des tables propres aux analystes via des vues et des rôles de sécurité.
Data sharing inter-entreprises
Snowflake permet de partager des datasets en temps réel entre partenaires commerciaux sans copie de données, via la fonctionnalité Data Marketplace.
Feature store pour le Machine Learning
Les data scientists stockent et versionnent leurs features ML dans Snowflake, interrogeables via Python ou SQL directement depuis les notebooks d'entraînement.
Analyse de données imbriquées (JSON/semi-structuré)
Snowflake ingère nativement les données JSON, Avro ou Parquet via le type VARIANT, permettant d'analyser des logs ou des événements web sans transformation préalable.
✓ Points forts
✗ Limites
⚠️ Pièges connus en production
✓ Fait pour vous si…
Équipes analytics et data engineering cherchant un warehouse managé performant, sans gestion d'infrastructure. Idéal pour les entreprises avec des besoins SQL importants.
✗ Pas fait pour vous si…
Workloads ML/IA intensifs, organisations très coût-sensibles sans expertise pour optimiser le compute.
Snowflake — The Complete Masterclass
MOOCUdemy
Hands-On Essentials: Data Warehouse
Formation officielleSnowflake (Snowflake University)
Introduction to Snowflake
MOOCDataCamp