Precision
Motivation
Diagnostiquer la capacité à retourner des bonnes réponses.
Analyse
Indépendamment de l'exhaustivité des bonnes réponses retournées (la capacité de rappel), la
précision indique combien de réponses sont bonnes dans ce qui est retourné par le système. Le but est donc de
mesurer à quel point on évite les erreurs de type 1 que sont les faux positifs
(réponses présentées comme bonnes, mais qui en réalité ne le sont pas).
La précision est le pourcentage de réponses correctes, c'est-à-dire la proportion de prédictions
correctes (vrais positifs) dans un ensemble des prédictions pour ne classe donnée (pour une classification
binaire, ce serait la somme des positifs, qu'ils soient corrects ou non).
Conception
`P = "vrais positifs"/("vrais positifs" + "faux positifs")`
Exemples
- Dans un système de classification de pourriels (spam mail), la précision représenterait le
nombre d'emails correctement identifiés comme spam.
- Dans un système de recherche de documents, il s'agirait du pourcentage réellement pertinent par rapport à la
requête de recherche. Par exemple si une recherche retourne 60 documents sur 100 disponibles, et que seuls 50 sont
réellement pertinents, la précision sera de `50/(50 + 10) = 50/60 = 0,83`, soit 83% s1Lemire, Daniel: "Précision et rappel", INF 6460.
- Il est théoriquement facile d’obtenir une précision proche de 100 % si l'on se limite à retourner des réponses
dont on est très sûr(e)s. Cependant, la valeur de rappel en sera très mauvaise, car nombre
d'autres bonnes réponses n'auront pas été fournies.
- La précision est utilisé dans le calcul du score de fiabilité F1.