Trino (anciennement PrestoSQL) est un moteur de requêtes SQL distribué permettant d'interroger des sources de données hétérogènes depuis un seul point d'entrée : S3/ADLS (via Hive Metastore), Iceberg, Kafka, PostgreSQL, MySQL, MongoDB, et même des APIs REST. Très utilisé comme couche de fédération de données (data mesh) et comme moteur de requêtes dans les architectures Lakehouse.
Fédération de sources de données hétérogènes
Trino permet d'exécuter des requêtes SQL qui joignent simultanément des données depuis S3, PostgreSQL, Kafka et Elasticsearch sans déplacer les données, via son architecture de connecteurs.
Requêtage interactif sur data lake
Les équipes data utilisent Trino pour interroger des fichiers Parquet ou ORC stockés sur S3 ou HDFS avec des temps de réponse de quelques secondes pour des explorations ad hoc.
Couche SQL sur lakehouse Apache Iceberg
Trino est l'un des principaux moteurs de requête pour les tables Apache Iceberg, permettant des opérations DML (INSERT, UPDATE, DELETE) et des time-travel queries directement en SQL standard.
Virtualisation de données pour le self-service BI
Les architectures data modernes utilisent Trino comme couche sémantique unifiée, offrant aux analystes un point d'accès SQL unique vers toutes les sources sans duplication des données.
✓ Points forts
✗ Limites
✓ Fait pour vous si…
Architectures data mesh nécessitant une fédération SQL entre sources hétérogènes. Requêtes sur fichiers Iceberg/Delta Lake dans un data lake.
✗ Pas fait pour vous si…
Équipes cherchant un warehouse complet avec stockage. Petites équipes sans expertise distributed computing.
Trino: The Definitive Guide
DocumentationO'Reilly / documentation officielle
Introduction to Trino
Formation officielleStarburst Academy
Trino SQL Query Engine
MOOCUdemy