Cross-Industry Standard Process for Data Mining : processus inter-industries standard pour
l'exploration de données.
Analyse
CRISP est un effort de standardisation d'un processus de data
science, sorte de version itérative du KDD.
Conception
CRISP définit un processus itératif contenant les étapes suivantes :
- Compréhension du métier : il est impossible de comprendre les données sans comprendre les
processus métiers qui les ont générées
- Compréhension des données : exploration et sélection de données
- Préparation des données (feature engineering, rééchelonnage, etc.)
- Analyse/modélisation : sélection et paramétrage des algorithmes d'apprentissage
- Evaluation/validation : métriques d'évaluation, test à l'aveugle
- Présentation/visualisation des résultats auprès du métier et éventuel déploiement d'une automatisation
si satisfaisant
Notes
- Initié en par l'UE dans le cadre du projet ESPRIT, et développé par ISL
(racheté par SPSS et lui même par IBM), NCR, Daimler-Benz et OHRA.
- Version 1.0 en
- Version 2.0 initiée en