Data Universe
Newsletter
Newsletter gratuite

La data & l'IA
en français.

Chaque semaine, les actualités data & IA les plus importantes — triées, traduites et expliquées par des praticiens français. Zéro jargon inutile.

👥
2 400+
abonnés
📖
52
éditions
4.8/5
satisfaction

S'abonner gratuitement

100% gratuit. Désabonnement en un clic. Aucun spam, jamais.

Tes données ne seront jamais vendues ni partagées. Promis.

Ce que tu reçois chaque semaine

🤖

IA & LLMs

Les avancées concrètes en IA générative, nouveaux modèles et cas d'usage réels chaque semaine.

⚙️

Data Engineering

dbt, Spark, Kafka, Delta Lake, pipelines — ce que les Data Engineers doivent savoir.

☁️

Cloud Data

AWS, Azure, GCP : nouveaux services, patterns d'architecture et comparatifs objectifs.

💼

Marché & Carrière

Salaires, certifications, compétences demandées et conseils pour progresser.

🏛️

Gouvernance & Réglementation

RGPD, taxonomie ESG, Bâle IV — les obligations réglementaires expliquées simplement.

Ce que tu reçois vraiment

Aperçu de l'édition #12

Lundi 9 juin 2026 · 4 min de lecture

Data Universe Weekly · #12
9 juin 2026 · 4 min de lecture

📬 dbt expliqué, un pipeline automatisé et 2 actus clés

🔧 Outil de la semaine

🔧
dbt Core
L'outil qui transforme SQL en pipelines professionnels
SQL versionné avec Git — fini les scripts perdus sur des SharePoints
Tests automatiques : unicité, non-nullité, cohérence référentielle
Documentation générée depuis le code — toujours à jour
Compatible Snowflake, BigQuery, Databricks, PostgreSQL
🎓 Certification disponible : dbt Analytics Engineering

💡 Cas d'usage

Automatiser le reporting mensuel avec dbt + Airflow

ContexteUne équipe finance passe 3 jours/mois à consolider des fichiers Excel éparpillés dans 4 SharePoints.
SolutionUn modèle dbt agrège toutes les sources en 15 min, déclenché par Airflow le 1er du mois à 7h.
RésultatLe rapport est disponible à 7h15. L'équipe économise 3 jours de travail manuel chaque mois.
{{ config(materialized='table', tags=['finance','monthly']) }}

WITH ventes AS (
  SELECT * FROM {{ ref('stg_ventes') }}
  WHERE date_trunc('month', date) = date_trunc('month', current_date - interval '1 month')
)
SELECT region, SUM(montant) AS ca_reel FROM ventes GROUP BY 1

📰 Actualités de la semaine

🆕

Databricks lance le Context Engineer Associate

Databricks vient d'ouvrir les inscriptions à une toute nouvelle certification : le Context Engineer Associate. Elle valide la capacité à concevoir des systèmes de contexte pour les agents IA — autrement dit, comment alimenter correctement un LLM avec les bonnes données au bon moment pour qu'il prenne de meilleures décisions.

C'est un signal fort : le métier de “Context Engineer” est en train de s'institutionnaliser. Si tu travailles sur des pipelines RAG ou des agents IA, cette certification va rapidement devenir un marqueur de crédibilité sur le marché.

Source : Databricks Blog · 6 juin 2026Voir la fiche Databricks →
📅

Snowflake MLOps Engineer Beta — lancement le 15 juin

Dans 6 jours, SnowPro Advanced : MLOps Engineerquitte son statut bêta et devient une certification officielle. C'est la 9ème certification du catalogue Snowflake et la première entièrement dédiée au déploiement et monitoring de modèles ML directement dans Snowpark.

Bonne nouvelle pour ceux qui ont passé la bêta : les résultats sont maintenus et la certification sera rétroactivement convertie. Si tu hésitais, c'est le bon moment pour t'inscrire avant que le prix monte.

Source : Snowflake Training · 5 juin 2026Voir la fiche Snowflake →
⚠️

AWS ML Specialty retiré depuis le 31 mars — alternatives

Pour ceux qui n'ont pas encore eu l'info : l'AWS Certified Machine Learning – Specialty a officiellement été retiré le 31 mars 2026. AWS le remplace par deux certifications plus précises : ML Engineer Associate (déploiement et opérations MLOps) et AI Practitioner (fondamentaux IA/ML).

Si tu préparais le ML Specialty, réoriente-toi vers le ML Engineer Associate qui est plus opérationnel et mieux aligné avec les besoins du marché en 2026.

Source : AWS Certification · mars 2026Voir les certifs AWS →

📖 2 définitions à connaître

Data Lineage

Le data lineage(ou lignée de données) désigne la capacité à tracer le chemin d'une donnée depuis sa source jusqu'à son utilisation finale : d'où vient-elle ? Quelles transformations a-t-elle subies ? Dans quels rapports est-elle utilisée ?

Exemple concret :Si le chiffre d'affaires dans ton dashboard Tableau est faux, le lineage te permet de remonter : Tableau → modèle dbt mart_sales → staging Snowflake → source Salesforce → pour trouver exactement où l'erreur s'est glissée.

Slowly Changing Dimension (SCD)

Une Slowly Changing Dimensionest une dimension d'un data warehouse dont les attributs changent lentement dans le temps — par opposition aux faits qui changent en continu. La question centrale : quand un client déménage, garde-t-on l'ancienne adresse pour les ventes passées, ou écrasons-nous la valeur ?

Les 3 types principaux :SCD Type 1 (on écrase — simple mais perte d'historique), SCD Type 2 (on crée une nouvelle ligne avec date de début/fin — le standard), SCD Type 3 (on ajoute une colonne “ancienne valeur” — compromis).

⚡ Tip de la semaine

Dans dbt, utilise {{ this }}dans un modèle incrémental pour référencer la table elle-même. Ça marche quel que soit l'environnement (dev/prod) et tu n'as jamais à écrire le nom de la table en dur. Indispensable pour les modèles qui tournent en production.

{{ config(materialized='incremental', unique_key='event_id') }}

SELECT * FROM {{ ref('stg_events') }}
{% if is_incremental() %}
  -- {{ this }} = la table elle-même, quel que soit l'environnement
  WHERE created_at > (SELECT MAX(created_at) FROM {{ this }})
{% endif %}
Data Universe
Data Universe.fr · Se désabonner

Ce qu'en disent les abonnés

La meilleure newsletter data en français. Concise, utile, sans bullshit. Je l'attends chaque lundi.

Sarah M.

Data Engineer, BNP Paribas

En tant que consultant, Data Universe me permet de rester à jour sans passer des heures à lire des articles en anglais.

Thomas R.

Consultant Senior Data, Capgemini

L'encyclopédie et la newsletter forment un duo parfait. Je retrouve toujours ce dont j'ai besoin.

Amira K.

Data Analyst, SNCF

J'ai décroché mon premier poste de Data Analyst deux mois après m'être abonné. La section Métiers et les fiches certifications ont été déterminantes pour préparer mes entretiens.

Julien F.

Data Analyst junior, PME e-commerce — abonné depuis 3 mois

Je viens du marketing et je ne comprenais rien au jargon de mon équipe data. Après 4 semaines de newsletter, je suis enfin dans la conversation.

Margaux D.

Responsable Marketing digital — débutante en data

Le parcours Débuter en data m'a donné une feuille de route claire. J'ai suivi les 5 étapes dans l'ordre et obtenu ma certif Google Data Analytics en 3 mois.

Romain T.

Étudiant reconverti, ex-gestionnaire de patrimoine