Data Universe
Newsletter
AccueilOutilsSnowflake
Snowflake logo

Snowflake

Data Warehouse

Le cloud data warehouse multi-cloud de référence

Tarif

Pay-per-use (crédits Snowflake) — Trial 30 jours avec 400$ de crédits

Intermédiaire

Snowflake est le cloud data warehouse qui s'est imposé comme standard entre 2018 et 2024. Son architecture révolutionnaire sépare le stockage du compute, permettant une scalabilité élastique. Disponible sur AWS, Azure et GCP, il s'est imposé comme le standard pour les entreprises mid-market et enterprise en France.

Séparation compute/storage
Multi-cloud natif
Zero-copy cloning
Time Travel (90 jours)
Data Sharing natif
Snowpark (Python/Java/Scala)
Auto-suspend et auto-resume
Marketplace de données
Horizon Catalog (gouvernance unifiée)
Dynamic Data Masking
Row Access Policies
1

Entrepôt de données centralisé

Les équipes data centralisent toutes leurs sources (ERP, CRM, marketing) dans Snowflake via des pipelines ELT, puis exposent des tables propres aux analystes via des vues et des rôles de sécurité.

2

Data sharing inter-entreprises

Snowflake permet de partager des datasets en temps réel entre partenaires commerciaux sans copie de données, via la fonctionnalité Data Marketplace.

3

Feature store pour le Machine Learning

Les data scientists stockent et versionnent leurs features ML dans Snowflake, interrogeables via Python ou SQL directement depuis les notebooks d'entraînement.

4

Analyse de données imbriquées (JSON/semi-structuré)

Snowflake ingère nativement les données JSON, Avro ou Parquet via le type VARIANT, permettant d'analyser des logs ou des événements web sans transformation préalable.

✓ Points forts

+Zéro gestion d'infrastructure
+Performances analytiques excellentes
+SQL standard étendu très complet
+Gouvernance native solide (Horizon Catalog, Dynamic Masking, Row Access Policies)
+Partage de données entre organisations simplifié
+Scalabilité instantanée
+Excellent support et documentation

✗ Limites

Coût élevé en cas de mauvaise gestion du compute
Moins adapté aux workloads ML que Databricks
Vendor lock-in modéré
Pas open source

⚠️ Pièges connus en production

1.Auto-suspend mal configuré : oublier de régler l'auto-suspend (ou le mettre trop long) fait exploser la facture. Règle de base : 60s sur les warehouses interactifs.
2.Spillage sur disque silencieux : les requêtes qui spillent sur disque sont 10-50x plus lentes sans warning visible. Surveiller BYTES_SPILLED_TO_REMOTE_STORAGE dans QUERY_HISTORY.
3.Clustering keys sur haute cardinalité : créer des clustering keys sur des colonnes à haute cardinalité déclenche une reclustering automatique coûteuse.
4.Time Travel sur tables très volatiles : le Time Travel à 90 jours sur des tables avec des millions d'UPDATEs journaliers peut multiplier le coût de stockage par 5.

✓ Fait pour vous si…

Équipes analytics et data engineering cherchant un warehouse managé performant, sans gestion d'infrastructure. Idéal pour les entreprises avec des besoins SQL importants.

✗ Pas fait pour vous si…

Workloads ML/IA intensifs, organisations très coût-sensibles sans expertise pour optimiser le compute.

🎓 SnowPro Core Certification

Associé

Snowflake

Voir la certification →

🎓 SnowPro Associate: Platform

Fondamental

Snowflake

Voir la certification →

🎓 SnowPro Advanced: Data Engineer

Professionnel

Snowflake

Voir la certification →

🎓 SnowPro Advanced: Architect

Professionnel

Snowflake

Voir la certification →

🎓 SnowPro Advanced: Administrator

Professionnel

Snowflake

Voir la certification →

🎓 SnowPro Advanced: Data Analyst

Professionnel

Snowflake

Voir la certification →

🎓 SnowPro Advanced: Security Engineer

Professionnel

Snowflake

Voir la certification →

🎓 SnowPro Advanced: Data Scientist

Professionnel

Snowflake

Voir la certification →

🎓 SnowPro Advanced: MLOps Engineer (Beta — juin 2026)

Professionnel

Snowflake

Voir la certification →

🎓 SnowPro Specialty: Snowpark

Expert

Snowflake

Voir la certification →

🎓 SnowPro Specialty: Native Apps

Expert

Snowflake

Voir la certification →

🎓 SnowPro Specialty: Gen AI

Expert

Snowflake

Voir la certification →

Snowflake — The Complete Masterclass

MOOC

Udemy

~15€

Hands-On Essentials: Data Warehouse

Formation officielle

Snowflake (Snowflake University)

Gratuit

Introduction to Snowflake

MOOC

DataCamp

~50€/mois
cloudsqlanalyticsenterprisemulti-cloud