Knowledge Discovery in Databases (découverte de connaissances dans les bases de données) puis Knowledge Discovery and Data Mining (découverte de connaissances et exploration de données).
créer un ensemble de données cible : sélectionner un ensemble de données, ou se concentrer sur
un sous-ensemble de variables, ou des échantillons de données, sur lesquels la découverte doit être faite.
Nettoyage et prétraitement des données
Suppression du bruit ou des valeurs aberrantes (outliers)
Recueil de l'information nécessaire pour modéliser ou expliquer le bruit
Stratégies pour gérer les colonnes où manquent des données
Expliquer la séquence temporelle et les changements connus
Réduction et projection de données
Recherche des colonnes utiles pour représenter les données en fonction de l'objectif de la tâche.
Utiliser la réduction de dimensions ou des méthodes de transformation pour réduire le nombre effectif de
variables prises consideration ou pour trouver des représentations invariantes des données.
Sélectionner la ou les méthodes à utiliser pour rechercher des schémas dans les données.
Décider quels modèles et paramètres pourraient être appropriés.
Faire correspondre une méthode de data mining donnée avec l'ensemble des critères du processus KDD.
Data mining : Rechercher des schémas intéressants dans une forme particulière de représentation
ou un ensemble de ces représentations en tant que arbres ou règles de classification, regression, clustering, etc.