Gradacyjna analiza odpowiedniości

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Gradacyjna analiza odpowiedniości (lub korespondencji, GCA, z ang. Grade Correspondence Analysis) – metoda statystyczna pozwalająca na znajdowanie ukrytych zależności w tablicy dwudzielczej. Należy do metod gradacyjnej analizy danych.

W najprostszym przypadku wiersze tablicy są traktowane jako etykiety jednej zmiennej nominalnej (zwanej zmienną wierszową), a kolumny jako etykiety drugiej zmiennej (kolumnowej). Wartości komórek tablicy tworzą (po normalizacji do 1) łączny rozkład prawdopodobieństwa tych dwóch zmiennych. Celem GCA jest ustalenie porządku możliwych wartości każdej z tych zmiennych w taki sposób, aby wybrany wskaźnik zależności pomiędzy zmienną wierszową i kolumnową był maksymalny. Wskaźnikiem tym może być współczynnik korelacji rang Spearmana lub tau Kendalla. Metoda ta stanowi odpowiednik klasycznej analizy odpowiedniości w której maksymalizowany jest współczynnik korelacji Pearsona.

Gradacyjna analiza odpowiedniości może być też stosowana do danych w których każda kolumna odpowiada innej zmiennej, a wiersze stanowią obserwacje.

Bibliografia[edytuj | edytuj kod]

  • Artykuł w którym wprowadzono wersję dla rho Spearmana: A. Ciok, T. Kowalczyk, E. Pleszczyńska, W. Szczesny. Algorithms of grade correspondence-cluster analysis. „The Collected Papers of Theoretical and Applied Computer Science”. Vol. 6, No. 1-4, 3-20, 1995. 
  • Artykuł w którym wprowadzono wersję dla tau Kendalla: T. Kowalczyk, M. Niewiadomska-Bugaj. Grade Correspondence Analysis Based on Kendall's tau. „Data Science Classification and Related Methods. VI Conference of the International Federation of Classification Societes, Rome, July 21-24, Institutio Nazionale de Statistica, Roma”, s. 182-185, 1998. 
  • Szersze omówienie teorii: Teresa Kowalczyk, Elżbieta Pleszczyńska, Fred Ruland, (red.): Grade Models and Methods for Data Analysis with Applications for the Analysis of Data Populations. Berlin Heidelberg New York: Springer Verlag, 2004, seria: Studies in Fuzziness and Soft Computing vol. 151. ISBN 9783540211204.