Data Universe
Newsletter
Accueil/Encyclopédie/Amazon SageMaker
🔬CloudAvancéAWS - Machine Learning

Amazon SageMaker

La plateforme MLOps d'AWS. Couvre tout le cycle ML : exploration (Studio), entraînement distribué, tuning automatique, déploiement d'endpoints, monitoring et MLOps.

💡Explication simple

SageMaker, c'est l'atelier complet du Data Scientist sur AWS. Au lieu de configurer des serveurs, tu cliques : je veux entraîner un modèle XGBoost sur 100 000 lignes → SageMaker lance un serveur, entraîne, l'arrête automatiquement. Tu déploies ensuite le modèle en un clic, il est accessible via une API, et SageMaker surveille sa performance en production.

🏗️Exemple concret

Pipeline complet : SageMaker Data Wrangler pour nettoyer les données (sans code), SageMaker AutoML pour trouver le meilleur modèle automatiquement, SageMaker Model Registry pour versionner, SageMaker Endpoint pour servir l'API. Tout sans gérer d'infrastructure.

∑ Concept clé

Coût = instances EC2 (ml.m5.xlarge = ~0.23$/h) + stockage S3 + inférence endpoint (ml.t2.medium = ~0.05$/h)

🎯Quand l'utiliser ?

Projets ML AWS en production
Entraînement distribué sur grandes données
MLOps : versioning, CI/CD ML, monitoring de modèles

✅ Avantages

+Environnement géré : pas de serveurs à configurer
+Intégration native avec S3, Glue, Step Functions
+SageMaker Autopilot pour le no-code ML

⚠️ Limites

Coûteux si les instances ne sont pas arrêtées
Courbe d'apprentissage importante
Vendor lock-in AWS

🛠️ Outils principaux

SageMaker Python SDK
SageMaker Studio (IDE web)
SageMaker Pipelines
SageMaker Feature Store
AWSMLMLOpsCloudDeep Learning

Concepts liés

🌊

Amazon Kinesis Data Streams

AWS - Streaming

🏪

Amazon Redshift

AWS - Data Warehouse

🪣

Amazon S3 (Simple Storage Service)

AWS - Stockage

🏔️

AWS Bedrock — IA Générative sur AWS

IA Générative Cloud

← Retour à l'encyclopédie