Processus de création, sélection et transformation des variables (features) qui serviront d'input à un modèle de machine learning. C'est souvent la tâche qui a le plus d'impact sur la performance du modèle, bien plus que le choix de l'algorithme lui-même. Les techniques incluent la normalisation, le one-hot encoding, la création de variables d'interaction, les lag features (valeurs passées pour les séries temporelles), et l'extraction de features à partir de textes ou d'images. Un bon feature engineering requiert une compréhension profonde du domaine métier et des données. Avec les LLMs et le deep learning, une partie de ce travail est automatisée, mais reste essentielle pour les données tabulaires.