Accueil›Outils›Google BigQuery

Google BigQuery

Data Warehouse

L'entrepôt de données serverless de Google, référence pour le SQL analytique à pétaoctets

Tarif

Pay-per-query (5$/To traité) ou slots réservés (flat rate). Storage : 0.02$/Go/mois. 1 To/mois de requêtes gratuit.

Free tierDébutant

Présentation

BigQuery est le data warehouse serverless de Google Cloud, connu pour sa capacité à exécuter des requêtes SQL sur des pétaoctets en quelques secondes sans aucune gestion d'infrastructure. Son architecture sépare compute et storage de façon transparente. BigQuery ML permet d'entraîner des modèles directement en SQL. Très populaire dans les startups et scale-ups qui veulent démarrer vite sans gestion d'infra.

Fonctionnalités clés

✓Serverless : zéro infrastructure à gérer

✓BigQuery ML (entraînement de modèles en SQL)

✓BigQuery Omni (requêtes cross-cloud S3/Azure)

✓Partitioning et clustering automatiques

✓Materialized Views

✓BigQuery BI Engine (cache in-memory pour Looker/Data Studio)

✓Data Transfer Service (ingestion automatisée)

✓Row-level et column-level security

✓BigQuery Datasets Marketplace

✓Intégration native avec Vertex AI

Cas d'usage

Analytics e-commerce à grande échelle

Analyse de milliards d'événements web et app en SQL, avec BigQuery ML pour la prédiction de churn directement en SQL sans exporter les données.

Data warehouse GCP-first

Centralisation de toutes les sources (Firebase, Google Ads, CRM) dans BigQuery via le Data Transfer Service et dbt pour les transformations.

✓ Points forts

+Démarrage immédiat sans configuration

+Performance excellent sur les requêtes analytiques complexes

+Facturation à la requête (idéal pour les charges variables)

+Intégration native avec tout l'écosystème Google Cloud

+BigQuery ML réduit les frictions entre SQL et ML

✗ Limites

−Coût difficile à prévoir avec le modèle pay-per-query

−Moins adapté aux workloads transactionnels OLTP

−Pas d'annulation de requête gratuite (on paie même si on annule)

−Vendor lock-in GCP fort

⚠️ Pièges connus en production

1.Les requêtes en SELECT * sur des tables partitionnées sans filtre sur la partition ignorent le partitioning et scannent tout — coût ×10 à ×100.

2.Les tables non partitionnées avec des milliards de lignes coûtent très cher à requêter. Toujours partitionner par date d'ingestion.

3.BigQuery facture les To scannés avant d'appliquer les filtres WHERE. Un COUNT(*) sur une table de 1 To coûte autant qu'un SELECT complet.

4.Les Materialized Views ne sont pas toujours utilisées par l'optimiseur. Vérifier le plan d'exécution.

✓ Fait pour vous si…

Équipes data sur GCP voulant un warehouse serverless sans gestion d'infra. Parfait pour les analyses exploratoires, les startups et les cas d'usage ML-SQL.

✗ Pas fait pour vous si…

Organisations souhaitant éviter le vendor lock-in GCP ou ayant des workloads OLTP importants.

cloudsqlserverlessanalyticsgcp