Accueil›Outils›Trino

Trino

Query Engine

Le moteur SQL distribué pour requêter toutes vos sources en même temps

Tarif

Open source gratuit / Starburst Enterprise sur devis

Open sourceFree tierAvancé

Présentation

Trino (anciennement PrestoSQL) est un moteur de requêtes SQL distribué permettant d'interroger des sources de données hétérogènes depuis un seul point d'entrée : S3/ADLS (via Hive Metastore), Iceberg, Kafka, PostgreSQL, MySQL, MongoDB, et même des APIs REST. Très utilisé comme couche de fédération de données (data mesh) et comme moteur de requêtes dans les architectures Lakehouse.

Fonctionnalités clés

✓Connecteurs 20+ sources (Iceberg, Hive, Delta Lake, RDBMS, NoSQL...)

✓Requêtes fédérées entre sources différentes

✓SQL ANSI complet avec extensions

✓Exécution distribuée et parallélisée

✓Cost-based optimizer

✓Starburst Enterprise (distribution managée)

✓Intégration dbt native

Cas d'usage

Fédération de sources de données hétérogènes

Trino permet d'exécuter des requêtes SQL qui joignent simultanément des données depuis S3, PostgreSQL, Kafka et Elasticsearch sans déplacer les données, via son architecture de connecteurs.

Requêtage interactif sur data lake

Les équipes data utilisent Trino pour interroger des fichiers Parquet ou ORC stockés sur S3 ou HDFS avec des temps de réponse de quelques secondes pour des explorations ad hoc.

Couche SQL sur lakehouse Apache Iceberg

Trino est l'un des principaux moteurs de requête pour les tables Apache Iceberg, permettant des opérations DML (INSERT, UPDATE, DELETE) et des time-travel queries directement en SQL standard.

Virtualisation de données pour le self-service BI

Les architectures data modernes utilisent Trino comme couche sémantique unifiée, offrant aux analystes un point d'accès SQL unique vers toutes les sources sans duplication des données.

✓ Points forts

+Fédération de données : requêtes cross-sources en SQL pur

+Connecteur Iceberg de référence

+Standard pour les architectures data mesh

+Open source et très actif

+SQL standard — faible courbe d'apprentissage SQL

✗ Limites

−Pas de stockage propre (seulement un moteur de requêtes)

−Configuration et tuning cluster complexes

−Performances inférieures à BigQuery/Snowflake sur les requêtes complexes

−Pas de version cloud managée officielle (Starburst est payant)

✓ Fait pour vous si…

Architectures data mesh nécessitant une fédération SQL entre sources hétérogènes. Requêtes sur fichiers Iceberg/Delta Lake dans un data lake.

✗ Pas fait pour vous si…

Équipes cherchant un warehouse complet avec stockage. Petites équipes sans expertise distributed computing.

Formations recommandées

Trino: The Definitive Guide

Documentation

O'Reilly / documentation officielle

Gratuit

Introduction to Trino

Formation officielle

Starburst Academy

Gratuit

Trino SQL Query Engine

MOOC

Udemy

~15€

open-sourcequery-enginesqlfederationdata-mesh