Data Universe
Newsletter

Outils & Plateformes

89 fiches détaillées : description, scores, pros/cons et alternatives pour chaque outil majeur.

A–Z
Airbyte logo
Airbyte
Intégration (EL)

L'alternative open source à Fivetran pour l'intégration de données

Idéal pour

Équipes budget-conscientes ou avec des besoins de connecteurs custom. Organisations préférant l'open source.

Open sourceFree tieropen-sourceintegration
Altimate Code
Data Engineering

Le harnais agentique open source #1 pour data engineering — dbt, SQL, 10 warehouses

Idéal pour

Data engineers et analytics engineers qui veulent un agent IA spécialisé pour dbt et SQL — revues de code, migrations de dialectes, audits PII, détection de breaking changes.

Open sourceFree tierdata-engineeringdbt
🔴
Amazon Redshift
Data Warehouse

Le data warehouse cloud d'AWS, optimisé pour les workloads analytiques massifs

Idéal pour

Organisations AWS-first avec des besoins analytiques massifs et un besoin d'intégration profonde avec S3, Glue et SageMaker.

Free tiercloudsql
Amazon SageMaker logo
Amazon SageMaker
ML Platform

La plateforme ML managée d'AWS pour entraîner, déployer et monitorer des modèles à grande échelle

Idéal pour

Organisations AWS-first souhaitant un environnement MLOps complet et intégré avec S3, ECR, IAM et les autres services AWS.

Free tierawsml
📊
Amplitude
Business Intelligence

La plateforme de product analytics de référence pour comprendre le comportement utilisateur

Idéal pour

Product managers et équipes growth cherchant à comprendre les comportements utilisateurs sans écrire de SQL.

Free tierproduct-analyticsbehavior
Apache Airflow logo
Apache Airflow
Orchestration

L'orchestrateur de pipelines data open source de référence

Idéal pour

Équipes data engineering expérimentées avec des pipelines complexes. Organisations nécessitant une personnalisation poussée.

Open sourceFree tieropen-sourceorchestration
Apache Flink logo
Apache Flink
Stream Processing

Le moteur de traitement streaming de référence pour les pipelines temps réel à haute volumétrie

Idéal pour

Équipes traitant des flux d'événements à haute volumétrie avec des contraintes de latence strictes : détection de fraude temps réel, alerting sur logs, dashboards live, streaming ETL.

Open sourceFree tierstreamingopen-source
🔥
Apache Hudi
Table Format

Format de table open source optimisé pour les ingestions CDC à haute fréquence sur S3

Idéal pour

Pipelines de streaming avec des millions d'upserts par heure (CDC depuis bases de données), surtout sur AWS EMR.

Open sourceFree tieropen-sourcecdc
Apache Iceberg logo
Apache Iceberg
Table Format

Le format de table ouvert qui donne des capacités ACID à votre data lake

Idéal pour

Architectures Lakehouse ouvertes sur S3/ADLS/GCS. Équipes voulant éviter le vendor lock-in de Delta Lake ou une solution cloud.

Open sourceFree tieropen-sourcetable-format
Apache Kafka logo
Apache Kafka
Streaming

La plateforme de streaming d'événements distribuée

Idéal pour

Architectures événementielles à fort volume, pipelines temps réel, découplage de microservices.

Open sourceFree tieropen-sourcestreaming
Apache Spark logo
Apache Spark
Processing

Le moteur de traitement distribué Big Data

Idéal pour

Traitement de données à grande échelle (>100 Go), pipelines ML distribués, transformations complexes.

Open sourceFree tieropen-sourcebig-data
Apache Superset logo
Apache Superset
Business Intelligence

La BI open source de référence pour les équipes techniques

Idéal pour

Équipes data engineering et technique cherchant une BI open source performante. Organisations souhaitant une alternative à Metabase avec plus de types de visualisations.

Open sourceFree tieropen-sourcebi
🌟
Astronomer
Orchestration

Apache Airflow managé — la plateforme Astro pour les pipelines data de production

Idéal pour

Équipes data cherchant Airflow en production sans vouloir gérer l'infrastructure. Particulièrement bon avec dbt (Cosmos).

orchestrationairflow
AWS logo
AWS
Cloud Platform

Amazon Web Services — la plateforme cloud leader pour la data et l'IA

Idéal pour

Organisations cherchant la plateforme cloud la plus complète. Idéal pour tout projet data/ML en production nécessitant scalabilité et fiabilité maximales.

Free tiercloudenterprise
Azure logo
Azure
Cloud Platform

Microsoft Azure — la plateforme cloud incontournable en entreprise pour la data et le ML

Idéal pour

Organisations déjà dans l'écosystème Microsoft. Secteurs régulés (banque, assurance, santé) nécessitant conformité et support entreprise. Équipes utilisant Power BI.

Free tiercloudmicrosoft
🔵
Azure Machine Learning
ML Platform

La plateforme MLOps Microsoft pour entraîner, déployer et gouverner des modèles ML en enterprise

Idéal pour

Organisations Microsoft-centric cherchant une plateforme MLOps intégrée à Azure DevOps et Azure Active Directory, avec des exigences de conformité élevées.

Free tierazureml
🔄
Census
Intégration (EL)

La plateforme Reverse ETL qui active vos données warehouse dans vos outils CRM et marketing

Idéal pour

Équipes data cherchant à activer les scores ML et segments dans les outils CRM/marketing sans développement d'API custom.

Free tierreverse-etlactivation
ChromaDB logo
ChromaDB
IA Générative

La base de données vectorielle légère pour le prototypage RAG en Python

Idéal pour

Prototypage RAG, cours et tutoriels, applications locales ou petite échelle. Point de départ avant de migrer vers Pinecone ou Weaviate.

Open sourceFree tieropen-sourcevector-database
ClickHouse logo
ClickHouse
Data Warehouse

Le moteur OLAP colonne ultra-rapide pour l'analytique temps réel

Idéal pour

Analytique temps réel sur logs et événements, cas d'usage haute volumétrie avec besoin de latence sub-seconde. Alternative économique aux warehouses cloud.

Open sourceFree tieropen-sourceolap
📋
Collibra
Data Governance

La plateforme enterprise de gouvernance des données et de catalogue de données

Idéal pour

Grandes entreprises dans des secteurs régulés avec des enjeux forts de conformité (RGPD, BCBS 239) et un budget conséquent pour la gouvernance.

governancecatalog
Dagster logo
Dagster
Orchestration

L'orchestrateur orienté assets pour les équipes data modernes

Idéal pour

Équipes data engineering modernes qui pensent en termes d'assets (tables, fichiers, modèles). Projets dbt + Spark.

Open sourceFree tieropen-sourceorchestration
Dask logo
Dask
Data Processing

Calcul parallèle Python pour dépasser les limites de Pandas

Idéal pour

Data Scientists et ML Engineers voulant traiter des données > RAM sans apprendre Spark. Parallelisation de boucles Python et pipelines Scikit-learn.

Open sourceFree tieropen-sourcepython
Databricks logo
Databricks
Lakehouse / ML Platform

La plateforme Lakehouse unifiée pour la data et l'IA

Idéal pour

Équipes Data Engineering + Data Science qui veulent une plateforme unique. Workloads mixtes SQL + Python + ML. Organisations avec un volume massif de données.

DataHub logo
DataHub
Data Governance

Le catalogue de données open source de LinkedIn pour la gouvernance des métadonnées

Idéal pour

Grandes organisations tech voulant un catalogue open source avec lineage automatique. Équipes avec des compétences infra pour l'opérer.

Open sourceFree tieropen-sourcedata-catalog
Dataiku logo
Dataiku
ML Platform

La plateforme data science et MLOps enterprise française

Idéal pour

Grandes entreprises françaises voulant démocratiser la data science. Équipes mixtes experts/non-experts.

Free tierfrenchml-platform
dbt Cloud logo
dbt Cloud
Transformation

La plateforme managée dbt avec IDE, scheduler et CI/CD intégrés

Idéal pour

Équipes sans orchestrateur existant, analytics engineers qui veulent se concentrer sur le SQL, organisations qui démarrent avec dbt sans legacy infrastructure.

Free tiersaassql
dbt Core logo
dbt Core
Transformation

La version open source et gratuite du standard de transformation SQL

Idéal pour

Équipes avec un orchestrateur existant (Airflow, Dagster), contraintes budgétaires, ou souhait de garder le contrôle total sur l'infrastructure.

Open sourceFree tieropen-sourcesql
Delta Lake
Table Format

Le format de table open source qui apporte les transactions ACID aux data lakes sur object storage

Idéal pour

Équipes utilisant Databricks ou Apache Spark qui ont besoin de transactions ACID et de MERGE/UPDATE/DELETE sur leur data lake.

Open sourceFree tieropen-sourcelakehouse
🐳
Docker
Infrastructure

La plateforme de containerisation qui standardise l'exécution des applications data et ML

Idéal pour

Standardisation des environnements de développement et déploiement d'applications data/ML sur n'importe quel infrastructure.

Open sourceFree tierinfrastructurecontainers
🐍
DSPy
IA Générative

Programmez vos LLMs au lieu de les prompter — le framework Python pour les pipelines IA robustes

Idéal pour

Ingénieurs cherchant à construire des pipelines LLM robustes, testables et optimisables automatiquement en production.

Open sourceFree tierllmframework
DuckDB logo
DuckDB
Query Engine

Le moteur SQL analytique embarqué le plus rapide pour les petits volumes

Idéal pour

Analyses locales sur fichiers Parquet/CSV, remplacement de Pandas pour les transformations SQL, prototypage rapide, pipelines ELT sur données <50 Go.

Open sourceFree tieropen-sourcesql
Elasticsearch logo
Elasticsearch
Query Engine

Le moteur de recherche et d'analyse distribué le plus utilisé au monde

Idéal pour

Moteurs de recherche, observabilité et logs (ELK stack), recherche sémantique hybride (fulltext + vectoriel).

Free tiersearchlogs
📄
Evidence
Business Intelligence

BI as code — créez des rapports analytiques professionnels avec du SQL et du Markdown

Idéal pour

Analytics engineers cherchant une approche BI-as-code, intégrée à dbt, versionnée dans Git.

Open sourceFree tierbiopen-source
Evidently AI logo
Evidently AI
MLOps

Le framework open source pour le monitoring et l'évaluation des modèles ML en production

Idéal pour

Équipes ML qui veulent surveiller leurs modèles en production sans infrastructure complexe. Idéal en complément de MLflow ou W&B.

Open sourceFree tieropen-sourcemlops
FastAPI logo
FastAPI
Data Apps

Le framework Python le plus rapide pour exposer des APIs et des modèles ML

Idéal pour

Exposition de modèles ML en API REST, microservices data, backends pour applications Streamlit/React. Standard pour le serving de modèles.

Open sourceFree tieropen-sourcepython
🍽️
Feast
ML Platform

Le feature store open source pour servir des features ML temps réel depuis votre data warehouse

Idéal pour

Équipes ML avec de nombreux modèles en production ayant besoin de features partagées entre entraînement et inférence temps réel.

Open sourceFree tierfeature-storeml
Fivetran logo
Fivetran
Intégration (EL)

L'intégration de données managée, clé en main

Idéal pour

Équipes data qui veulent se concentrer sur la transformation, pas l'ingestion. Budgets permettant un investissement SaaS.

saasintegration
GCP logo
GCP
Cloud Platform

Google Cloud Platform — leader en data analytics et IA avec BigQuery et Vertex AI

Idéal pour

Équipes data-centric cherchant le meilleur analytique (BigQuery) et ML (Vertex AI). Organisations déjà dans l'écosystème Google Workspace.

Free tiercloudanalytics
🔷
Google BigQuery
Data Warehouse

L'entrepôt de données serverless de Google, référence pour le SQL analytique à pétaoctets

Idéal pour

Équipes data sur GCP voulant un warehouse serverless sans gestion d'infra. Parfait pour les analyses exploratoires, les startups et les cas d'usage ML-SQL.

Free tiercloudsql
Google Vertex AI logo
Google Vertex AI
ML Platform

La plateforme ML unifiée de Google Cloud avec accès à Gemini et aux modèles de fondation

Idéal pour

Organisations GCP-first souhaitant un MLOps complet intégré avec BigQuery, et accès aux modèles Gemini en enterprise.

Free tiergcpml
🎛️
Gradio
Data Apps

Créez une interface web pour votre modèle ML en 3 lignes de Python

Idéal pour

Démos rapides de modèles ML, prototypage d'interfaces LLM, partage de modèles avec des non-techniciens.

Open sourceFree tierdemoml
Grafana logo
Grafana
Business Intelligence

La plateforme open source de monitoring et observabilité

Idéal pour

Monitoring de pipelines data, surveillance de la qualité des données, observabilité des modèles ML en production. Complément de MLflow ou Evidently.

Open sourceFree tieropen-sourcemonitoring
Great Expectations logo
Great Expectations
Data Quality

Le framework open source de référence pour la qualité et la validation des données en pipeline

Idéal pour

Équipes data engineering qui veulent tester automatiquement la qualité des données dans leurs pipelines CI/CD. Particulièrement adapté aux pipelines Pandas/Spark et aux équipes qui n'utilisent pas encore dbt.

Open sourceFree tierdata-qualityopen-source
Hugging Face logo
Hugging Face
IA & ML

Le GitHub des modèles et datasets ML open source

Idéal pour

Recherche, expérimentation et fine-tuning de LLMs. Accès aux meilleurs modèles open source.

Open sourceFree tieropen-sourcellm
JupyterLab logo
JupyterLab
IDE & Notebooks

L'environnement de notebooks interactifs standard pour la data science

Idéal pour

Exploration de données, prototypage, enseignement, communication de résultats. Point de départ de toute formation data.

Open sourceFree tieropen-sourcepython
Kestra logo
Kestra
Orchestration

L'orchestrateur data déclaratif open source nouvelle génération

Idéal pour

Équipes data cherchant une alternative à Airflow plus simple et moderne. Profils non Python-experts. Équipes françaises appréciant le support local.

Open sourceFree tieropen-sourceorchestration
☸️
Kubernetes (K8s)
Infrastructure

Le standard d'orchestration de containers en production pour les workloads data et ML à grande échelle

Idéal pour

Grandes équipes data avec des workloads ML à grande échelle, des clusters Spark/Kafka/Airflow, et besoin d'auto-scaling et haute disponibilité.

Open sourceinfrastructurecontainers
LangChain logo
LangChain
IA Générative

Le framework Python pour orchestrer des applications LLM et des agents IA

Idéal pour

Applications RAG, chatbots sur documents, agents IA, pipelines LLM complexes nécessitant mémoire et outils.

Open sourceFree tierllmrag
🔭
Langfuse
IA Générative

L'observabilité open source pour vos applications LLM — traces, évaluations et coûts

Idéal pour

Équipes développant des applications LLM souhaitant une observabilité complète avec contrôle des données (RGPD).

Open sourceFree tierllmobservability
💡
Lightdash
Business Intelligence

L'outil BI open source conçu pour les utilisateurs de dbt — explorez vos modèles sans recoder

Idéal pour

Équipes data-centric utilisant dbt qui veulent offrir le self-service BI sans dupliquer la logique dans un outil BI séparé.

Open sourceFree tierbiopen-source
LlamaIndex logo
LlamaIndex
IA Générative

Le framework Python spécialisé dans le RAG et l'indexation de données pour les LLMs

Idéal pour

Applications RAG sur documents complexes, pipelines d'indexation de données structurées/non structurées pour LLMs.

Open sourceFree tierllmrag
Looker logo
Looker
Business Intelligence

La BI sémantique de Google, axée sur la gouvernance des métriques

Idéal pour

Grandes organisations cherchant une source de vérité unique pour les métriques. Équipes sur Google Cloud. Embedded Analytics.

google-cloudbi
🧙
Mage AI
Orchestration

L'outil de data pipeline moderne et intuitif — l'alternative à Airflow pour les équipes data

Idéal pour

Équipes data souhaitant un orchestrateur plus simple qu'Airflow, avec une expérience de développement interactive.

Open sourceFree tierorchestrationopen-source
Metabase logo
Metabase
Business Intelligence

La BI open source accessible à toute l'équipe

Idéal pour

Startups et PMEs. Équipes avec utilisateurs non-techniques. Budget limité.

Open sourceFree tieropen-sourcebi
🎬
Metaflow
ML Platform

Le framework ML workflow de Netflix — définissez vos pipelines ML comme du Python simple

Idéal pour

Data scientists qui veulent industrialiser leurs notebooks Python en pipelines ML reproductibles sans apprendre un DSL complexe.

Open sourceFree tiermlworkflow
Microsoft Fabric logo
Microsoft Fabric
Lakehouse / ML Platform

La plateforme analytics tout-en-un Microsoft qui unifie Power BI, Synapse et Azure ML sur OneLake

Idéal pour

Organisations déjà investies dans l'écosystème Microsoft (M365, Azure, Power BI) cherchant à consolider leur stack data.

Free tiermicrosoftcloud
🔷
Microsoft Purview
Data Governance

La solution de gouvernance et conformité Microsoft qui unifie data catalog, DLP et conformité RGPD

Idéal pour

Organisations Microsoft-centric cherchant une gouvernance de données et conformité intégrée à M365 et Azure.

microsoftgovernance
MLflow logo
MLflow
MLOps

Le standard open source pour le tracking des expériences ML

Idéal pour

Tout data scientist ou ML engineer. Point de départ pour le tracking ML avant d'investir dans une plateforme MLOps complète.

Open sourceFree tieropen-sourcemlops
🍃
MongoDB
Data Processing

La base de données NoSQL documentaire de référence pour stocker des données semi-structurées

Idéal pour

Stockage de données semi-structurées, catalogues produits avec attributs variables, résultats d'APIs REST, logs applicatifs structurés.

Open sourceFree tiernosqldocument
🎲
Monte Carlo
Data Quality

La plateforme de référence pour l'observabilité des données — détection d'anomalies et lineage automatiques

Idéal pour

Équipes data en croissance ayant des incidents qualité fréquents et souhaitant une observabilité automatique sans investissement en règles manuelles.

observabilityquality
🦙
Ollama
IA Générative

Lancez des LLMs open source en local en une commande — Llama, Mistral, Qwen sur votre machine

Idéal pour

Développement local, prototypage d'applications LLM, tests de modèles, projets data en local sur Mac M-series.

Open sourceFree tierllmlocal
OpenAI API logo
OpenAI API
IA Générative

L'API des modèles GPT-4.1, GPT-4o, o1 et Whisper pour vos applications IA

Idéal pour

Prototypage rapide d'applications LLM, extraction d'information structurée, génération de contenu, chatbots, transcription.

llmia-generative
🎯
Optuna
Frameworks ML

Le framework Python de référence pour l'optimisation automatique d'hyperparamètres ML

Idéal pour

Optimisation d'hyperparamètres de modèles ML tabulaires (XGBoost, LightGBM) et deep learning sur machine unique ou cluster Joblib.

Open sourceFree tierhyperparameteroptimization
Pandas logo
Pandas
Data Processing

La bibliothèque DataFrame de référence en Python depuis 15 ans

Idéal pour

Débutants en data science, manipulation de datasets <1 Go, intégration avec l'écosystème ML (Scikit-learn, PyTorch), formation et prototypage rapide.

Open sourceFree tieropen-sourcepython
Pinecone logo
Pinecone
IA Générative

La base de données vectorielle managée de référence pour les applications RAG

Idéal pour

Applications RAG en production, recherche sémantique sur documents, recommandation basée sur embeddings. Standard pour les apps LangChain.

Free tiervector-databaserag
Polars logo
Polars
Data Processing

DataFrame ultra-rapide en Rust pour remplacer Pandas

Idéal pour

Remplacement de Pandas pour les transformations sur datasets >1 Go, pipelines ELT Python haute performance, projets qui démarrent sans legacy Pandas.

Open sourceFree tieropen-sourcepython
🐘
PostgreSQL
Data Processing

La base de données relationnelle open source la plus avancée — couteau suisse des équipes data

Idéal pour

Base opérationnelle robuste, stockage de données de référence, base d'APIs data, et analyses légères sur des datasets < 100 Go.

Open sourceFree tieropen-sourcesql
Power BI logo
Power BI
Business Intelligence

L'outil BI Microsoft, standard des entreprises françaises

Idéal pour

Entreprises sur l'écosystème Microsoft. Équipes analytics de taille moyenne. Utilisateurs venant d'Excel.

Free tiermicrosoftbi
Prefect logo
Prefect
Orchestration

L'orchestrateur Python moderne, plus simple qu'Airflow

Idéal pour

Data engineers Python cherchant une alternative plus agréable à Airflow. Pipelines ML et data science.

Open sourceFree tieropen-sourceorchestration
PyTorch logo
PyTorch
Frameworks ML

Le framework deep learning de référence pour la recherche et la production

Idéal pour

Deep learning, NLP, LLMs, vision par ordinateur, recherche en IA, fine-tuning de modèles fondationaux.

Open sourceFree tieropen-sourcedeep-learning
🎯
Qdrant
IA Générative

Base de données vectorielle open source en Rust, optimisée pour la recherche sémantique à haute performance

Idéal pour

Équipes cherchant une base vectorielle open source performante avec la liberté du self-hosting et un contrôle total des données.

Open sourceFree tiervector-dbopen-source
Qlik Sense logo
Qlik Sense
Business Intelligence

La BI self-service avec moteur associatif pour les analyses ad hoc

Idéal pour

Équipes métier voulant explorer librement des données sans requêtes fixes. Organisations avec des analyses ad hoc complexes.

biself-service
☀️
Ray
ML Platform

Framework open source pour le ML distribué — entraînement, hyperparameter tuning et serving à l'échelle

Idéal pour

Entraînement distribué de modèles ML/DL, hyperparameter tuning à grande échelle, et serving de modèles ML complexes en production.

Open sourceFree tierdistributedml
Redash logo
Redash
Business Intelligence

La BI open source SQL-first simple et légère

Idéal pour

Équipes data engineering voulant un outil BI interne simple. Dashboards opérationnels pour les profils techniques.

Open sourceFree tieropen-sourcebi
🔴
Redis
Data Processing

La base de données in-memory de référence — cache, pub/sub, feature store et recherche vectorielle

Idéal pour

Caching de requêtes/API, feature store ML pour l'inférence temps réel, pub/sub léger, sessions utilisateurs.

Open sourceFree tiercachein-memory
SAS Viya logo
SAS Viya
ML Platform

La plateforme analytique SAS cloud-native pour les grandes organisations

Idéal pour

Grandes organisations dans les secteurs banque, assurance, santé avec des besoins de scoring réglementé et d'auditabilité des modèles.

enterpriseml-platform
Scikit-learn logo
Scikit-learn
Frameworks ML

La bibliothèque ML Python incontournable pour les modèles classiques

Idéal pour

Tout Data Scientist qui commence le ML, projets de classification/régression sur données tabulaires, prototypage rapide.

Open sourceFree tieropen-sourcepython
🔗
Segment (Twilio)
Data Processing

La Customer Data Platform (CDP) de référence — collectez une fois, envoyez partout

Idéal pour

Équipes produit/marketing cherchant à connecter toutes leurs sources de données comportementales à leurs outils marketing et analytics sans développement custom.

Free tiercdptracking
Snowflake logo
Snowflake
Data Warehouse

Le cloud data warehouse multi-cloud de référence

Idéal pour

Équipes analytics et data engineering cherchant un warehouse managé performant, sans gestion d'infrastructure. Idéal pour les entreprises avec des besoins SQL importants.

Soda Core logo
Soda Core
Data Quality

Le framework de qualité des données open source orienté déclaratif

Idéal pour

Équipes dbt cherchant à ajouter des checks de qualité de données dans leur pipeline. Alternative à Great Expectations plus simple à démarrer.

Open sourceFree tierdata-qualityopen-source
Streamlit logo
Streamlit
Data Apps

Créez des applications data et ML en Python en quelques minutes

Idéal pour

Prototypes d'applications data, démos ML, dashboards internes pour les équipes métier, applications LLM simples.

Open sourceFree tieropen-sourcepython
Tableau logo
Tableau
Business Intelligence

La référence de la dataviz pour les analyses complexes

Idéal pour

Équipes analytics avec besoins de visualisations complexes et personnalisées. Organisations Salesforce.

salesforcebi
Talend logo
Talend
Intégration (EL)

La plateforme d'intégration de données ETL enterprise française

Idéal pour

DSI françaises avec systèmes legacy (SAP, Oracle) cherchant à intégrer des données complexes. Projets de qualité et gouvernance des données.

etlenterprise
🧠
TensorFlow
Frameworks ML

Le framework de deep learning open source de Google, standard industriel pour la production ML

Idéal pour

Déploiement de modèles deep learning en production (mobile, edge, web, serving). Pipelines ML industriels avec TFX.

Open sourceFree tierdeep-learningopen-source
Terraform logo
Terraform
Infrastructure

L'outil d'Infrastructure as Code de référence pour les data platforms

Idéal pour

Équipes data engineering gérant leur infrastructure cloud (S3, Databricks, Snowflake, ADF...) avec des environnements multiples.

Free tieriacinfrastructure
Trino logo
Trino
Query Engine

Le moteur SQL distribué pour requêter toutes vos sources en même temps

Idéal pour

Architectures data mesh nécessitant une fédération SQL entre sources hétérogènes. Requêtes sur fichiers Iceberg/Delta Lake dans un data lake.

Open sourceFree tieropen-sourcequery-engine
vLLM
IA Générative

Le serveur d'inférence LLM haute performance — 24x plus rapide que HuggingFace Transformers naïf

Idéal pour

Déploiement en production de LLMs open source avec de forts volumes de requêtes et exigences de latence.

Open sourceFree tierllmserving
Weaviate logo
Weaviate
IA Générative

La base de données vectorielle open source avec GraphQL et modules IA

Idéal pour

Applications RAG nécessitant de la souveraineté des données ou un self-hosting. Multi-tenancy, ingestion automatique d'embeddings.

Open sourceFree tieropen-sourcevector-database
Weights & Biases logo
Weights & Biases
MLOps

La plateforme MLOps de référence pour le tracking et la visualisation d'expériences ML

Idéal pour

Data Scientists et ML Engineers qui entraînent des modèles DL ou fine-tunent des LLMs, équipes de recherche.

Free tiermlopsexperiment-tracking