Klasyfikacja statystyczna

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Klasyfikacja statystyczna to rodzaj algorytmu statystycznego, który przydziela obserwacje statystyczne do klas, bazując na atrybutach (cechach) tych obserwacji.

Formalnie, ten problem można przedstawić następująco: dla danego zbioru danych trenujących \{(\mathbf{x_1},y),\dots,(\mathbf{x_n}, y)\} znaleźć klasyfikator h:\mathcal{X}\rightarrow\mathcal{Y}, który przydziela obiektowi \mathbf{x} \in \mathcal{X} klasę y \in \mathcal{Y}. Przykładowo, jeśli problem dotyczy filtrowania spamu, wówczas \mathbf{x_i} to pewna reprezentacja wiadomości, a y to "spam" lub "nie spam".

Przykłady klasyfikatorów:

Zobacz też[edytuj | edytuj kod]