Google Vertex AI — ML Platform sur GCP

Plateforme ML unifiée de Google Cloud qui couvre l'entraînement, le déploiement et le monitoring de modèles ML, avec accès à Gemini et aux modèles open source.

💡Explication simple

Vertex AI est la réponse de Google à SageMaker (AWS) et Azure ML. C'est le point d'entrée unique pour tout ce qui est ML sur Google Cloud : entraîner des modèles custom sur des TPUs, déployer des endpoints de prédiction managés, accéder à Gemini (les LLMs de Google), construire des pipelines ML avec Vertex Pipelines, et stocker les modèles dans le Model Registry. Le tout intégré avec BigQuery, AlloyDB et le Data Catalog.

🏗️Exemple concret

Une startup e-commerce utilise Vertex AI : entraînement d'un modèle de recommandation sur 100M d'événements dans BigQuery (Vertex Training sur TPUs, 3h), déploiement en endpoint managé (autoscaling 0-100 replicas selon le trafic), monitoring du drift via Vertex Monitoring. 40ms de latence de prédiction. Coût : 800/mois pour 5M de prédictions/jour.

🎯Quand l'utiliser ?

✓Organisations GCP-first avec BigQuery comme data warehouse

✓Besoin d'accès aux modèles Gemini avec contrôles GCP

✓Entraînement de modèles personnalisés sur TPUs Google

✓Pipelines ML Kubeflow managés sans infrastructure à gérer

✅ Avantages

+TPUs Google pour l'entraînement (bien plus rapides que GPU pour certains modèles)

+Intégration native BigQuery (entraîner depuis BQ sans exporter)

+Accès à Gemini avec sécurité enterprise

⚠️ Limites

−Complexité de la plateforme (nombreux services à maîtriser)

−Moins mature que SageMaker sur certains aspects MLOps

−Lock-in GCP

🛠️ Outils principaux

Vertex AI Training

Vertex AI Endpoints

Vertex AI Pipelines (Kubeflow)

Vertex AI Model Registry

Gemini API via Vertex

GCPMLCloudGeminiMLOpsTPU

Concepts liés

☁️

Amazon Kinesis Data Streams

AWS - Streaming

☁️

Amazon Redshift

AWS - Data Warehouse

🔗

Amazon S3 (Simple Storage Service)

AWS - Stockage

☁️

Amazon SageMaker

AWS - Machine Learning

← Retour à l'encyclopédie