Z Wikipedii, wolnej encyklopedii
Tablica pomyłek (macierz błędów) jest stosowana przy ocenie jakości klasyfikacji binarnej (na dwie klasy). Dane oznaczone etykietami: pozytywną i negatywną poddawane są klasyfikacji, która przypisuje im predykowaną klasę pozytywną albo predykowaną klasę negatywną. Możliwa jest sytuacja, że dana oryginalnie oznaczona jako pozytywna zostanie omyłkowo zaklasyfikowana jako negatywną. Wszystkie takie sytuacje przedstawia tablica pomyłek .
Tablica ma dwa wiersze i dwie kolumny. Wiersze przedstawiają klasy predykowane, kolumny zaś klasy rzeczywiste.
Klasa rzeczywista
pozytywna
negatywna
Klasa predykowana
pozytywna
prawdziwie pozytywna (TP)
fałszywie pozytywna (FP)
negatywna
fałszywie negatywna (FN)
prawdziwie negatywna (TN)
Na bazie częstości występowania rzeczywistego stanu pozytywnego w populacji oraz wzajemnych relacji prawidłowych i nieprawidłowych klasyfikacji można wyróżnić szereg miar wartości diagnostycznej testu. Poniższy wykres podsumowuje ich powiązania, przy czym jest ułożony odwrotnie niż tablica powyżej:
Klasa predykowana – wynik testu
Populacja
Klasyfikacja pozytywna
Klasyfikacja negatywna
Częstość występowania, chorobowość
∑
stan pozytywny
∑
populacja
{\displaystyle {\frac {\scriptstyle \sum {\text{stan pozytywny}}}{\scriptstyle \sum {\text{populacja}}}}}
Klasa rzeczywista
Stan pozytywny
prawdziwie dodatnia , TP
fałszywie ujemna (błąd drugiego rodzaju , FN )
czułość , TPR
∑
T
P
∑
T
P
+
∑
F
N
{\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {OliveGreen}TP} }{\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+\sum {\color {Red}FN}} }}}
FNR
∑
F
N
∑
T
P
+
∑
F
N
{\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {Red}FN} }{\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+\sum {\color {Red}FN}} }}}
Stan negatywny
fałszywie dodatnia (błąd pierwszego rodzaju , FP )
prawdziwie ujemna , TN
FPR
∑
F
P
∑
F
P
+
∑
T
N
{\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {Red}FP} }{\scriptstyle \sum \mathbf {{\color {Red}FP}+\sum {\color {OliveGreen}TN}} }}}
swoistość , SPC, TNR
∑
T
N
∑
F
P
+
∑
T
N
{\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {OliveGreen}TN} }{\scriptstyle \sum \mathbf {{\color {Red}FP}+\sum {\color {OliveGreen}TN}} }}}
dokładność , ACC
∑
T
P
+
∑
T
N
∑
populacja
{\displaystyle {\frac {\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+} \scriptstyle \sum \mathbf {\color {OliveGreen}TN} }{\scriptstyle \sum {\text{populacja}}}}}
precyzja , PPV
∑
T
P
∑
T
P
+
∑
F
P
{\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {OliveGreen}TP} }{\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+\sum {\color {Red}FP}} }}}
FOR
∑
F
N
∑
F
N
+
∑
T
N
{\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {Red}FN} }{\scriptstyle \sum \mathbf {{\color {Red}FN}+\sum {\color {OliveGreen}TN}} }}}
LR+
T
P
R
F
P
R
{\displaystyle {\frac {\scriptstyle \mathbf {\color {OliveGreen}TPR} }{\scriptstyle \mathbf {\color {OliveGreen}FPR} }}}
DOR
L
R
+
L
R
−
{\displaystyle {\frac {\scriptstyle \mathbf {\color {OliveGreen}LR+} }{\scriptstyle \mathbf {\color {OliveGreen}LR-} }}}
FDR
∑
F
P
∑
T
P
+
∑
F
P
{\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {Red}FP} }{\scriptstyle \sum \mathbf {{\color {OliveGreen}TP}+\sum {\color {Red}FP}} }}}
NPV
∑
T
N
∑
F
N
+
∑
T
N
{\displaystyle {\frac {\scriptstyle \sum \mathbf {\color {OliveGreen}TN} }{\scriptstyle \sum \mathbf {{\color {Red}FN}+\sum {\color {OliveGreen}TN}} }}}
LR-
F
N
R
T
N
R
{\displaystyle {\frac {\scriptstyle \mathbf {\color {OliveGreen}FNR} }{\scriptstyle \mathbf {\color {OliveGreen}TNR} }}}
Miary:
prawdziwie pozytywna (ang. true positive, TP)
prawdziwie negatywna (ang. true negative, TN)
fałszywie pozytywna (ang. false positive, FP), błąd pierwszego rodzaju
fałszywie negatywna (ang. false negative, FN), błąd drugiego rodzaju
czułość (ang. sensitivity, recall ) lub odsetek prawdziwie pozytywnych (ang. true positive rate , TPR)
T
P
R
=
T
P
/
P
=
T
P
/
(
T
P
+
F
N
)
{\displaystyle TPR=TP/P=TP/(TP+FN)}
swoistość (ang. specificity , SPC) lub odsetek prawdziwie negatywnych (ang. true negative rate , TNR)
T
N
R
=
T
N
/
N
=
T
N
/
(
F
P
+
T
N
)
{\displaystyle TNR=TN/N=TN/(FP+TN)}
precyzja (ang. precision , lub positive predictive value , PPV – wartość predykcyjna dodatnia)
p
r
e
c
y
z
j
a
=
T
P
/
(
T
P
+
F
P
)
{\displaystyle precyzja=TP/(TP+FP)}
A
C
C
=
(
T
P
+
T
N
)
/
(
P
+
N
)
{\displaystyle ACC=(TP+TN)/(P+N)}
Klasa rzeczywista
pozytywna
negatywna
Klasa predykowana
pozytywna
Ludzie chorzy poprawnie zdiagnozowani jako chorzy
Ludzie zdrowi błędnie zdiagnozowani jako chorzy (błąd pierwszego rodzaju )
negatywna
Ludzie chorzy błędnie zdiagnozowani jako zdrowi (błąd drugiego rodzaju )
Ludzie zdrowi poprawnie zdiagnozowani jako ludzie zdrowi