Indeks Jaccarda

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Indeks Jaccarda, współczynnik podobieństwa Jaccardastatystyka używana do porównywania zbiorów.

Współczynnik Jaccarda mierzy podobieństwo między dwoma zbiorami i jest zdefiniowany jako iloraz mocy części wspólnej zbiorów i mocy sumy tych zbiorów:

 J (A,B) = {{|A \cap B|}\over{|A \cup B|}}

Wartości przyjmowane przez współczynnik Jaccarda zawierają się w podzbiorze zbioru liczb rzeczywistych <0,1>. Jeśli współczynnik Jaccarda przyjmuje wartości bliskie zeru, zbiory są od siebie różne, natomiast przyjmując wartości bliskie 1, zbiory są do siebie podobne.