Écosystème data & IA

Outils & Plateformes

97 fiches détaillées : description, scores, pros/cons et alternatives pour chaque outil majeur.

A–Z

Airbyte

Intégration (EL)

L'alternative open source à Fivetran pour l'intégration de données

Idéal pour

Équipes budget-conscientes ou avec des besoins de connecteurs custom. Organisations préférant l'open source.

Open sourceFree tieropen-sourceintegration

Comparer Voir →

Alation

Data Catalog & Governance

Le catalogue de données intelligent pour la data governance

Idéal pour

Grandes entreprises avec un programme data governance structuré et de nombreuses sources de données.

data-cataloggovernance

Comparer Voir →

Altimate Code

Data Engineering

Le harnais agentique open source #1 pour data engineering — dbt, SQL, 10 warehouses

Idéal pour

Data engineers et analytics engineers qui veulent un agent IA spécialisé pour dbt et SQL — revues de code, migrations de dialectes, audits PII, détection de breaking changes.

Open sourceFree tierdata-engineeringdbt

Comparer Voir →

Amazon Redshift

Data Warehouse

Le data warehouse cloud d'AWS, optimisé pour les workloads analytiques massifs

Idéal pour

Organisations AWS-first avec des besoins analytiques massifs et un besoin d'intégration profonde avec S3, Glue et SageMaker.

Free tiercloudsql

Comparer Voir →

Amazon SageMaker

ML Platform

La plateforme ML managée d'AWS pour entraîner, déployer et monitorer des modèles à grande échelle

Idéal pour

Organisations AWS-first souhaitant un environnement MLOps complet et intégré avec S3, ECR, IAM et les autres services AWS.

Free tierawsml

Comparer Voir →

Amplitude

Business Intelligence

La plateforme de product analytics de référence pour comprendre le comportement utilisateur

Idéal pour

Product managers et équipes growth cherchant à comprendre les comportements utilisateurs sans écrire de SQL.

Free tierproduct-analyticsbehavior

Comparer Voir →

Anthropic (Claude API)

LLM / IA Générative

API des modèles Claude pour les applications IA

Idéal pour

Applications nécessitant un haut niveau de raisonnement, de nuance ou de sécurité.

llmia-generative

Comparer Voir →

Apache Airflow

Orchestration

L'orchestrateur de pipelines data open source de référence

Idéal pour

Équipes data engineering expérimentées avec des pipelines complexes. Organisations nécessitant une personnalisation poussée.

Open sourceFree tieropen-sourceorchestration

Comparer Voir →

Apache Flink

Stream Processing

Le moteur de traitement streaming de référence pour les pipelines temps réel à haute volumétrie

Idéal pour

Équipes traitant des flux d'événements à haute volumétrie avec des contraintes de latence strictes : détection de fraude temps réel, alerting sur logs, dashboards live, streaming ETL.

Open sourceFree tierstreamingopen-source

Comparer Voir →

Apache Hudi

Table Format

Format de table open source optimisé pour les ingestions CDC à haute fréquence sur S3

Idéal pour

Pipelines de streaming avec des millions d'upserts par heure (CDC depuis bases de données), surtout sur AWS EMR.

Open sourceFree tieropen-sourcecdc

Comparer Voir →

Apache Iceberg

Table Format

Le format de table ouvert qui donne des capacités ACID à votre data lake

Idéal pour

Architectures Lakehouse ouvertes sur S3/ADLS/GCS. Équipes voulant éviter le vendor lock-in de Delta Lake ou une solution cloud.

Open sourceFree tieropen-sourcetable-format

Comparer Voir →

Apache Kafka

Streaming

La plateforme de streaming d'événements distribuée

Idéal pour

Architectures événementielles à fort volume, pipelines temps réel, découplage de microservices.

Open sourceFree tieropen-sourcestreaming

Comparer Voir →

Apache Spark

Processing

Le moteur de traitement distribué Big Data

Idéal pour

Traitement de données à grande échelle (>100 Go), pipelines ML distribués, transformations complexes.

Open sourceFree tieropen-sourcebig-data

Comparer Voir →

Apache Superset

Business Intelligence

La BI open source de référence pour les équipes techniques

Idéal pour

Équipes data engineering et technique cherchant une BI open source performante. Organisations souhaitant une alternative à Metabase avec plus de types de visualisations.

Open sourceFree tieropen-sourcebi

Comparer Voir →

Astronomer

Orchestration

Apache Airflow managé — la plateforme Astro pour les pipelines data de production

Idéal pour

Équipes data cherchant Airflow en production sans vouloir gérer l'infrastructure. Particulièrement bon avec dbt (Cosmos).

orchestrationairflow

Comparer Voir →

AWS

Cloud Platform

Amazon Web Services — la plateforme cloud leader pour la data et l'IA

Idéal pour

Organisations cherchant la plateforme cloud la plus complète. Idéal pour tout projet data/ML en production nécessitant scalabilité et fiabilité maximales.

Free tiercloudenterprise

Comparer Voir →

Azure

Cloud Platform

Microsoft Azure — la plateforme cloud incontournable en entreprise pour la data et le ML

Idéal pour

Organisations déjà dans l'écosystème Microsoft. Secteurs régulés (banque, assurance, santé) nécessitant conformité et support entreprise. Équipes utilisant Power BI.

Free tiercloudmicrosoft

Comparer Voir →

Azure Machine Learning

ML Platform

La plateforme MLOps Microsoft pour entraîner, déployer et gouverner des modèles ML en enterprise

Idéal pour

Organisations Microsoft-centric cherchant une plateforme MLOps intégrée à Azure DevOps et Azure Active Directory, avec des exigences de conformité élevées.

Free tierazureml

Comparer Voir →

Census

Intégration (EL)

La plateforme Reverse ETL qui active vos données warehouse dans vos outils CRM et marketing

Idéal pour

Équipes data cherchant à activer les scores ML et segments dans les outils CRM/marketing sans développement d'API custom.

Free tierreverse-etlactivation

Comparer Voir →

ChromaDB

IA Générative

La base de données vectorielle légère pour le prototypage RAG en Python

Idéal pour

Prototypage RAG, cours et tutoriels, applications locales ou petite échelle. Point de départ avant de migrer vers Pinecone ou Weaviate.

Open sourceFree tieropen-sourcevector-database

Comparer Voir →

ClickHouse

Data Warehouse

Le moteur OLAP colonne ultra-rapide pour l'analytique temps réel

Idéal pour

Analytique temps réel sur logs et événements, cas d'usage haute volumétrie avec besoin de latence sub-seconde. Alternative économique aux warehouses cloud.

Open sourceFree tieropen-sourceolap

Comparer Voir →

Collibra

Data Governance

La plateforme enterprise de gouvernance des données et de catalogue de données

Idéal pour

Grandes entreprises dans des secteurs régulés avec des enjeux forts de conformité (RGPD, BCBS 239) et un budget conséquent pour la gouvernance.

governancecatalog

Comparer Voir →

Dagster

Orchestration

L'orchestrateur orienté assets pour les équipes data modernes

Idéal pour

Équipes data engineering modernes qui pensent en termes d'assets (tables, fichiers, modèles). Projets dbt + Spark.

Open sourceFree tieropen-sourceorchestration

Comparer Voir →

Dask

Data Processing

Calcul parallèle Python pour dépasser les limites de Pandas

Idéal pour

Data Scientists et ML Engineers voulant traiter des données > RAM sans apprendre Spark. Parallelisation de boucles Python et pipelines Scikit-learn.

Open sourceFree tieropen-sourcepython

Comparer Voir →

Databricks

Lakehouse / ML Platform

La plateforme Lakehouse unifiée pour la data et l'IA

Idéal pour

Équipes Data Engineering + Data Science qui veulent une plateforme unique. Workloads mixtes SQL + Python + ML. Organisations avec un volume massif de données.

cloudspark

Comparer Voir →

Datadog

Monitoring & Observabilité

Plateforme d'observabilité : monitoring, logs, APM et sécurité

Idéal pour

Entreprises souhaitant monitorer leurs stacks data, ML et infra dans une plateforme unique.

monitoringobservabilite

Comparer Voir →

DataHub

Data Governance

Le catalogue de données open source de LinkedIn pour la gouvernance des métadonnées

Idéal pour

Grandes organisations tech voulant un catalogue open source avec lineage automatique. Équipes avec des compétences infra pour l'opérer.

Open sourceFree tieropen-sourcedata-catalog

Comparer Voir →

Dataiku

ML Platform

La plateforme data science et MLOps enterprise française

Idéal pour

Grandes entreprises françaises voulant démocratiser la data science. Équipes mixtes experts/non-experts.

Free tierfrenchml-platform

Comparer Voir →

dbt Cloud

Transformation

La plateforme managée dbt avec IDE, scheduler et CI/CD intégrés

Idéal pour

Équipes sans orchestrateur existant, analytics engineers qui veulent se concentrer sur le SQL, organisations qui démarrent avec dbt sans legacy infrastructure.

Free tiersaassql

Comparer Voir →

dbt Core

Transformation

La version open source et gratuite du standard de transformation SQL

Idéal pour

Équipes avec un orchestrateur existant (Airflow, Dagster), contraintes budgétaires, ou souhait de garder le contrôle total sur l'infrastructure.

Open sourceFree tieropen-sourcesql

Comparer Voir →

Delta Lake

Table Format

Le format de table open source qui apporte les transactions ACID aux data lakes sur object storage

Idéal pour

Équipes utilisant Databricks ou Apache Spark qui ont besoin de transactions ACID et de MERGE/UPDATE/DELETE sur leur data lake.

Open sourceFree tieropen-sourcelakehouse

Comparer Voir →

Docker

Infrastructure

La plateforme de containerisation qui standardise l'exécution des applications data et ML

Idéal pour

Standardisation des environnements de développement et déploiement d'applications data/ML sur n'importe quel infrastructure.

Open sourceFree tierinfrastructurecontainers

Comparer Voir →

DSPy

IA Générative

Programmez vos LLMs au lieu de les prompter — le framework Python pour les pipelines IA robustes

Idéal pour

Ingénieurs cherchant à construire des pipelines LLM robustes, testables et optimisables automatiquement en production.

Open sourceFree tierllmframework

Comparer Voir →

DuckDB

Query Engine

Le moteur SQL analytique embarqué le plus rapide pour les petits volumes

Idéal pour

Analyses locales sur fichiers Parquet/CSV, remplacement de Pandas pour les transformations SQL, prototypage rapide, pipelines ELT sur données <50 Go.

Open sourceFree tieropen-sourcesql

Comparer Voir →

Elasticsearch

Query Engine

Le moteur de recherche et d'analyse distribué le plus utilisé au monde

Idéal pour

Moteurs de recherche, observabilité et logs (ELK stack), recherche sémantique hybride (fulltext + vectoriel).

Free tiersearchlogs

Comparer Voir →

Evidence

Business Intelligence

BI as code — créez des rapports analytiques professionnels avec du SQL et du Markdown

Idéal pour

Analytics engineers cherchant une approche BI-as-code, intégrée à dbt, versionnée dans Git.

Open sourceFree tierbiopen-source

Comparer Voir →

Evidently AI

MLOps

Le framework open source pour le monitoring et l'évaluation des modèles ML en production

Idéal pour

Équipes ML qui veulent surveiller leurs modèles en production sans infrastructure complexe. Idéal en complément de MLflow ou W&B.

Open sourceFree tieropen-sourcemlops

Comparer Voir →

FastAPI

Data Apps

Le framework Python le plus rapide pour exposer des APIs et des modèles ML

Idéal pour

Exposition de modèles ML en API REST, microservices data, backends pour applications Streamlit/React. Standard pour le serving de modèles.

Open sourceFree tieropen-sourcepython

Comparer Voir →

Feast

ML Platform

Le feature store open source pour servir des features ML temps réel depuis votre data warehouse

Idéal pour

Équipes ML avec de nombreux modèles en production ayant besoin de features partagées entre entraînement et inférence temps réel.

Open sourceFree tierfeature-storeml

Comparer Voir →

Fivetran

Intégration (EL)

L'intégration de données managée, clé en main

Idéal pour

Équipes data qui veulent se concentrer sur la transformation, pas l'ingestion. Budgets permettant un investissement SaaS.

saasintegration

Comparer Voir →

GCP

Cloud Platform

Google Cloud Platform — leader en data analytics et IA avec BigQuery et Vertex AI

Idéal pour

Équipes data-centric cherchant le meilleur analytique (BigQuery) et ML (Vertex AI). Organisations déjà dans l'écosystème Google Workspace.

Free tiercloudanalytics

Comparer Voir →

Google BigQuery

Data Warehouse

L'entrepôt de données serverless de Google, référence pour le SQL analytique à pétaoctets

Idéal pour

Équipes data sur GCP voulant un warehouse serverless sans gestion d'infra. Parfait pour les analyses exploratoires, les startups et les cas d'usage ML-SQL.

Free tiercloudsql

Comparer Voir →

Google Vertex AI

ML Platform

La plateforme ML unifiée de Google Cloud avec accès à Gemini et aux modèles de fondation

Idéal pour

Organisations GCP-first souhaitant un MLOps complet intégré avec BigQuery, et accès aux modèles Gemini en enterprise.

Free tiergcpml

Comparer Voir →

Gradio

Data Apps

Créez une interface web pour votre modèle ML en 3 lignes de Python

Idéal pour

Démos rapides de modèles ML, prototypage d'interfaces LLM, partage de modèles avec des non-techniciens.

Open sourceFree tierdemoml

Comparer Voir →

Grafana

Business Intelligence

La plateforme open source de monitoring et observabilité

Idéal pour

Monitoring de pipelines data, surveillance de la qualité des données, observabilité des modèles ML en production. Complément de MLflow ou Evidently.

Open sourceFree tieropen-sourcemonitoring

Comparer Voir →

Great Expectations

Data Quality

Le framework open source de référence pour la qualité et la validation des données en pipeline

Idéal pour

Équipes data engineering qui veulent tester automatiquement la qualité des données dans leurs pipelines CI/CD. Particulièrement adapté aux pipelines Pandas/Spark et aux équipes qui n'utilisent pas encore dbt.

Open sourceFree tierdata-qualityopen-source

Comparer Voir →

Hopsworks

Machine Learning Platform

La Feature Store open-source pour le ML en production

Idéal pour

équipes ML matures cherchant une Feature Store robuste en open-source.

Open sourceFree tierfeature-storemlops

Comparer Voir →

Hugging Face

IA & ML

Le GitHub des modèles et datasets ML open source

Idéal pour

Recherche, expérimentation et fine-tuning de LLMs. Accès aux meilleurs modèles open source.

Open sourceFree tieropen-sourcellm

Comparer Voir →

JupyterLab

IDE & Notebooks

L'environnement de notebooks interactifs standard pour la data science

Idéal pour

Exploration de données, prototypage, enseignement, communication de résultats. Point de départ de toute formation data.

Open sourceFree tieropen-sourcepython

Comparer Voir →

Kestra

Orchestration

L'orchestrateur data déclaratif open source nouvelle génération

Idéal pour

Équipes data cherchant une alternative à Airflow plus simple et moderne. Profils non Python-experts. Équipes françaises appréciant le support local.

Open sourceFree tieropen-sourceorchestration

Comparer Voir →

Kubernetes (K8s)

Infrastructure

Le standard d'orchestration de containers en production pour les workloads data et ML à grande échelle

Idéal pour

Grandes équipes data avec des workloads ML à grande échelle, des clusters Spark/Kafka/Airflow, et besoin d'auto-scaling et haute disponibilité.

Open sourceinfrastructurecontainers

Comparer Voir →

LangChain

IA Générative

Le framework Python pour orchestrer des applications LLM et des agents IA

Idéal pour

Applications RAG, chatbots sur documents, agents IA, pipelines LLM complexes nécessitant mémoire et outils.

Open sourceFree tierllmrag

Comparer Voir →

Langfuse

IA Générative

L'observabilité open source pour vos applications LLM — traces, évaluations et coûts

Idéal pour

Équipes développant des applications LLM souhaitant une observabilité complète avec contrôle des données (RGPD).

Open sourceFree tierllmobservability

Comparer Voir →

Lightdash

Business Intelligence

L'outil BI open source conçu pour les utilisateurs de dbt — explorez vos modèles sans recoder

Idéal pour

Équipes data-centric utilisant dbt qui veulent offrir le self-service BI sans dupliquer la logique dans un outil BI séparé.

Open sourceFree tierbiopen-source

Comparer Voir →

LlamaIndex

IA Générative

Le framework Python spécialisé dans le RAG et l'indexation de données pour les LLMs

Idéal pour

Applications RAG sur documents complexes, pipelines d'indexation de données structurées/non structurées pour LLMs.

Open sourceFree tierllmrag

Comparer Voir →

Looker

Business Intelligence

La BI sémantique de Google, axée sur la gouvernance des métriques

Idéal pour

Grandes organisations cherchant une source de vérité unique pour les métriques. Équipes sur Google Cloud. Embedded Analytics.

google-cloudbi

Comparer Voir →

Looker Studio

Business Intelligence

L'outil de dataviz gratuit de Google (ex-Data Studio)

Idéal pour

Marketing digital, suivi GA4, reporting web, équipes utilisant l'écosystème Google.

Free tierbidataviz

Comparer Voir →

Mage AI

Orchestration

L'outil de data pipeline moderne et intuitif — l'alternative à Airflow pour les équipes data

Idéal pour

Équipes data souhaitant un orchestrateur plus simple qu'Airflow, avec une expérience de développement interactive.

Open sourceFree tierorchestrationopen-source

Comparer Voir →

Metabase

Business Intelligence

La BI open source accessible à toute l'équipe

Idéal pour

Startups et PMEs. Équipes avec utilisateurs non-techniques. Budget limité.

Open sourceFree tieropen-sourcebi

Comparer Voir →

Metaflow

ML Platform

Le framework ML workflow de Netflix — définissez vos pipelines ML comme du Python simple

Idéal pour

Data scientists qui veulent industrialiser leurs notebooks Python en pipelines ML reproductibles sans apprendre un DSL complexe.

Open sourceFree tiermlworkflow

Comparer Voir →

Microsoft Fabric

Lakehouse / ML Platform

La plateforme analytics tout-en-un Microsoft qui unifie Power BI, Synapse et Azure ML sur OneLake

Idéal pour

Organisations déjà investies dans l'écosystème Microsoft (M365, Azure, Power BI) cherchant à consolider leur stack data.

Free tiermicrosoftcloud

Comparer Voir →

Microsoft Purview

Data Governance

La solution de gouvernance et conformité Microsoft qui unifie data catalog, DLP et conformité RGPD

Idéal pour

Organisations Microsoft-centric cherchant une gouvernance de données et conformité intégrée à M365 et Azure.

microsoftgovernance

Comparer Voir →

Mistral AI

LLM / IA Générative

Modèles LLM open-source et API française haute performance

Idéal pour

Entreprises françaises ou européennes cherchant la souveraineté IA et un coût maîtrisé.

Open sourceFree tierllmia-generative

Comparer Voir →

MLflow

MLOps

Le standard open source pour le tracking des expériences ML

Idéal pour

Tout data scientist ou ML engineer. Point de départ pour le tracking ML avant d'investir dans une plateforme MLOps complète.

Open sourceFree tieropen-sourcemlops

Comparer Voir →

MongoDB

Data Processing

La base de données NoSQL documentaire de référence pour stocker des données semi-structurées

Idéal pour

Stockage de données semi-structurées, catalogues produits avec attributs variables, résultats d'APIs REST, logs applicatifs structurés.

Open sourceFree tiernosqldocument

Comparer Voir →

Monte Carlo

Data Quality

La plateforme de référence pour l'observabilité des données — détection d'anomalies et lineage automatiques

Idéal pour

Équipes data en croissance ayant des incidents qualité fréquents et souhaitant une observabilité automatique sans investissement en règles manuelles.

observabilityquality

Comparer Voir →

Ollama

IA Générative

Lancez des LLMs open source en local en une commande — Llama, Mistral, Qwen sur votre machine

Idéal pour

Développement local, prototypage d'applications LLM, tests de modèles, projets data en local sur Mac M-series.

Open sourceFree tierllmlocal

Comparer Voir →

OpenAI API

IA Générative

L'API des modèles GPT-4.1, GPT-4o, o1 et Whisper pour vos applications IA

Idéal pour

Prototypage rapide d'applications LLM, extraction d'information structurée, génération de contenu, chatbots, transcription.

llmia-generative

Comparer Voir →

Optuna

Frameworks ML

Le framework Python de référence pour l'optimisation automatique d'hyperparamètres ML

Idéal pour

Optimisation d'hyperparamètres de modèles ML tabulaires (XGBoost, LightGBM) et deep learning sur machine unique ou cluster Joblib.

Open sourceFree tierhyperparameteroptimization

Comparer Voir →

Pandas

Data Processing

La bibliothèque DataFrame de référence en Python depuis 15 ans

Idéal pour

Débutants en data science, manipulation de datasets <1 Go, intégration avec l'écosystème ML (Scikit-learn, PyTorch), formation et prototypage rapide.

Open sourceFree tieropen-sourcepython

Comparer Voir →

Pinecone

IA Générative

La base de données vectorielle managée de référence pour les applications RAG

Idéal pour

Applications RAG en production, recherche sémantique sur documents, recommandation basée sur embeddings. Standard pour les apps LangChain.

Free tiervector-databaserag

Comparer Voir →

Polars

Data Processing

DataFrame ultra-rapide en Rust pour remplacer Pandas

Idéal pour

Remplacement de Pandas pour les transformations sur datasets >1 Go, pipelines ELT Python haute performance, projets qui démarrent sans legacy Pandas.

Open sourceFree tieropen-sourcepython

Comparer Voir →

PostgreSQL

Data Processing

La base de données relationnelle open source la plus avancée — couteau suisse des équipes data

Idéal pour

Base opérationnelle robuste, stockage de données de référence, base d'APIs data, et analyses légères sur des datasets < 100 Go.

Open sourceFree tieropen-sourcesql

Comparer Voir →

Power BI

Business Intelligence

L'outil BI Microsoft, standard des entreprises françaises

Idéal pour

Entreprises sur l'écosystème Microsoft. Équipes analytics de taille moyenne. Utilisateurs venant d'Excel.

Free tiermicrosoftbi

Comparer Voir →

Prefect

Orchestration

L'orchestrateur Python moderne, plus simple qu'Airflow

Idéal pour

Data engineers Python cherchant une alternative plus agréable à Airflow. Pipelines ML et data science.

Open sourceFree tieropen-sourceorchestration

Comparer Voir →

Pulumi

Infrastructure & DevOps

Infrastructure as Code avec les vrais langages de programmation

Idéal pour

équipes data/ML maîtrisant Python et souhaitant gérer l'infra avec le même langage.

Open sourceFree tieriacdevops

Comparer Voir →

PyTorch

Frameworks ML

Le framework deep learning de référence pour la recherche et la production

Idéal pour

Deep learning, NLP, LLMs, vision par ordinateur, recherche en IA, fine-tuning de modèles fondationaux.

Open sourceFree tieropen-sourcedeep-learning

Comparer Voir →

Qdrant

IA Générative

Base de données vectorielle open source en Rust, optimisée pour la recherche sémantique à haute performance

Idéal pour

Équipes cherchant une base vectorielle open source performante avec la liberté du self-hosting et un contrôle total des données.

Open sourceFree tiervector-dbopen-source

Comparer Voir →

Qlik Sense

Business Intelligence

La BI self-service avec moteur associatif pour les analyses ad hoc

Idéal pour

Équipes métier voulant explorer librement des données sans requêtes fixes. Organisations avec des analyses ad hoc complexes.

biself-service

Comparer Voir →

RabbitMQ

Messaging & Queuing

Le broker de messages open-source le plus utilisé

Idéal pour

Task queues, découplage microservices, workflows asynchrones à volume modéré.

Open sourceFree tiermessagingqueuing

Comparer Voir →

Ray

ML Platform

Framework open source pour le ML distribué — entraînement, hyperparameter tuning et serving à l'échelle

Idéal pour

Entraînement distribué de modèles ML/DL, hyperparameter tuning à grande échelle, et serving de modèles ML complexes en production.

Open sourceFree tierdistributedml

Comparer Voir →

Redash

Business Intelligence

La BI open source SQL-first simple et légère

Idéal pour

Équipes data engineering voulant un outil BI interne simple. Dashboards opérationnels pour les profils techniques.

Open sourceFree tieropen-sourcebi

Comparer Voir →

Redis

Data Processing

La base de données in-memory de référence — cache, pub/sub, feature store et recherche vectorielle

Idéal pour

Caching de requêtes/API, feature store ML pour l'inférence temps réel, pub/sub léger, sessions utilisateurs.

Open sourceFree tiercachein-memory

Comparer Voir →

SAS Viya

ML Platform

La plateforme analytique SAS cloud-native pour les grandes organisations

Idéal pour

Grandes organisations dans les secteurs banque, assurance, santé avec des besoins de scoring réglementé et d'auditabilité des modèles.

enterpriseml-platform

Comparer Voir →

Scikit-learn

Frameworks ML

La bibliothèque ML Python incontournable pour les modèles classiques

Idéal pour

Tout Data Scientist qui commence le ML, projets de classification/régression sur données tabulaires, prototypage rapide.

Open sourceFree tieropen-sourcepython

Comparer Voir →

Segment (Twilio)

Data Processing

La Customer Data Platform (CDP) de référence — collectez une fois, envoyez partout

Idéal pour

Équipes produit/marketing cherchant à connecter toutes leurs sources de données comportementales à leurs outils marketing et analytics sans développement custom.

Free tiercdptracking

Comparer Voir →

Snowflake

Data Warehouse

Le cloud data warehouse multi-cloud de référence

Idéal pour

Équipes analytics et data engineering cherchant un warehouse managé performant, sans gestion d'infrastructure. Idéal pour les entreprises avec des besoins SQL importants.

cloudsql

Comparer Voir →

Soda Core

Data Quality

Le framework de qualité des données open source orienté déclaratif

Idéal pour

Équipes dbt cherchant à ajouter des checks de qualité de données dans leur pipeline. Alternative à Great Expectations plus simple à démarrer.

Open sourceFree tierdata-qualityopen-source

Comparer Voir →

Streamlit

Data Apps

Créez des applications data et ML en Python en quelques minutes

Idéal pour

Prototypes d'applications data, démos ML, dashboards internes pour les équipes métier, applications LLM simples.

Open sourceFree tieropen-sourcepython

Comparer Voir →

Tableau

Business Intelligence

La référence de la dataviz pour les analyses complexes

Idéal pour

Équipes analytics avec besoins de visualisations complexes et personnalisées. Organisations Salesforce.

salesforcebi

Comparer Voir →

Talend

Intégration (EL)

La plateforme d'intégration de données ETL enterprise française

Idéal pour

DSI françaises avec systèmes legacy (SAP, Oracle) cherchant à intégrer des données complexes. Projets de qualité et gouvernance des données.

etlenterprise

Comparer Voir →

TensorFlow

Frameworks ML

Le framework de deep learning open source de Google, standard industriel pour la production ML

Idéal pour

Déploiement de modèles deep learning en production (mobile, edge, web, serving). Pipelines ML industriels avec TFX.

Open sourceFree tierdeep-learningopen-source

Comparer Voir →

Terraform

Infrastructure

L'outil d'Infrastructure as Code de référence pour les data platforms

Idéal pour

Équipes data engineering gérant leur infrastructure cloud (S3, Databricks, Snowflake, ADF...) avec des environnements multiples.

Free tieriacinfrastructure

Comparer Voir →

Trino

Query Engine

Le moteur SQL distribué pour requêter toutes vos sources en même temps

Idéal pour

Architectures data mesh nécessitant une fédération SQL entre sources hétérogènes. Requêtes sur fichiers Iceberg/Delta Lake dans un data lake.

Open sourceFree tieropen-sourcequery-engine

Comparer Voir →

vLLM

IA Générative

Le serveur d'inférence LLM haute performance — 24x plus rapide que HuggingFace Transformers naïf

Idéal pour

Déploiement en production de LLMs open source avec de forts volumes de requêtes et exigences de latence.

Open sourceFree tierllmserving

Comparer Voir →

Weaviate

IA Générative

La base de données vectorielle open source avec GraphQL et modules IA

Idéal pour

Applications RAG nécessitant de la souveraineté des données ou un self-hosting. Multi-tenancy, ingestion automatique d'embeddings.

Open sourceFree tieropen-sourcevector-database

Comparer Voir →

Weights & Biases

MLOps

La plateforme MLOps de référence pour le tracking et la visualisation d'expériences ML

Idéal pour

Data Scientists et ML Engineers qui entraînent des modèles DL ou fine-tunent des LLMs, équipes de recherche.

Free tiermlopsexperiment-tracking

Comparer Voir →