Indeks Jaccarda

Z Wikipedii, wolnej encyklopedii
Geometryczna wizualizacja Indeksu Jaccarda. Przedstawia trzy pary nakładających się kwadratów reprezentujących zbiory odpowiednio o niskim, wysokim i bardzo wysokim Indeksie Jaccarda.

Indeks Jaccarda, współczynnik podobieństwa Jaccardastatystyka używana do porównywania zbiorów.

Współczynnik Jaccarda mierzy podobieństwo między dwoma zbiorami i jest zdefiniowany jako iloraz mocy części wspólnej zbiorów i mocy sumy tych zbiorów:

Wartości przyjmowane przez współczynnik Jaccarda zawierają się w podzbiorze zbioru liczb rzeczywistych <0,1>. Jeśli współczynnik Jaccarda przyjmuje wartości bliskie zeru, zbiory są od siebie różne, natomiast gdy jest bliski 1, zbiory są do siebie podobne.