Data Universe
Newsletter
AccueilOutilsMongoDB
🍃

MongoDB

Data Processing

La base de données NoSQL documentaire de référence pour stocker des données semi-structurées

Tarif

Community gratuit (open source). Atlas Free Tier (512 Mo). Atlas Dedicated à partir de ~60€/mois.

Open sourceFree tierDébutant

MongoDB est la base de données NoSQL documentaire la plus populaire. Elle stocke les données en BSON (JSON binaire), ce qui la rend naturelle pour les données semi-structurées et les schémas évolutifs. Très utilisée dans les architectures data pour stocker des résultats d'API, des configurations, des logs structurés, et des données avec des structures variables. MongoDB Atlas offre une version cloud managée avec recherche full-text et Atlas Search (recherche vectorielle).

Stockage documentaire BSON (JSON étendu)
Index composites, text, géospatiaux et vectoriels
Aggregation Pipeline (transformation en-base)
Transactions ACID multi-documents
Réplication automatique et Replica Sets
Sharding horizontal natif
Change Streams pour le CDC
Atlas Search (Lucene-based full-text + vectoriel)
Atlas Data Federation (requêtes cross-sources)
1

Catalogue produit e-commerce

Chaque produit a des attributs différents (vêtement: taille/couleur, électronique: tension/connectique). MongoDB stocke ces documents hétérogènes sans schéma rigide.

✓ Points forts

+Schéma flexible — idéal pour les données semi-structurées
+Change Streams pour le CDC vers les pipelines data
+Aggregation Pipeline puissant pour les transformations
+Atlas offre un service managé simple à démarrer

✗ Limites

Pas adapté aux requêtes SQL complexes avec de nombreuses jointures
Consommation mémoire élevée par rapport à PostgreSQL
Duplication des données nécessaire pour éviter les jointures (dénormalisation)

⚠️ Pièges connus en production

1.Les indexes manquants sur les champs de filtrage entraînent des COLLSCANS qui bloquent les requêtes sur les grandes collections.
2.Les documents qui grandissent indéfiniment (pushing arrays sans limite) créent du fragmentation et ralentissent les lectures.

✓ Fait pour vous si…

Stockage de données semi-structurées, catalogues produits avec attributs variables, résultats d'APIs REST, logs applicatifs structurés.

✗ Pas fait pour vous si…

Données relationnelles fortement normalisées ou requêtes analytiques complexes (préférer PostgreSQL).

nosqldocumentopen-sourceflexibleatlas