Data science.
Motivation
Extraire des connaissances d'un ensemble de données.
Analyse
L'analyse des données est un travail pouvant aboutir à des projets de prédiction, d'autant plus
efficaces qu'ils se seront entraînés sur de gros volumes de
données.
Conception
Il n'y a pas de processus de data science figé mais un standard souvent adopté en la matière est CRISP :
- Compréhension du métier : il est impossible de comprendre les données sans comprendre les
processus métiers qui les ont générées
- Compréhension des données : exploration et sélection de données
- Préparation des données (feature engineering, rééchelonnage, etc.)
- Analyse/modélisation : sélection et paramétrage des algorithmes d'apprentissage
- Évaluation/validation : métriques d'évaluation, test à l'aveugle
- Présentation/visualisation des résultats auprès du métier et éventuel déploiement d'une automatisation
si satisfaisant
- Surveillance (monitoring) du modèle pour éviter qu'il
dérive.
Exemples
Des exemples de frameworks de data science sont :