Metoda Hellwiga

Z Wikipedii, wolnej encyklopedii

Metoda Hellwiga, zwana również metodą optymalnego wyboru predyktant, metodą wskaźników pojemności informacji – formalna metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona w 1968 roku przez Zdzisława Hellwiga.

Zmienne, które wybieramy do modelu powinny być silnie skorelowane ze zmienną objaśnianą, a słabo skorelowane między sobą. Nie jest to jednak ścisłe kryterium doboru zmiennych, oprócz tego występuje kryterium liczbowe, tzw. pojemność integralna kombinacji nośników informacji. W tym przypadku nośnikami informacji są wszystkie zmienne objaśniające.

Liczba kombinacji[edytuj | edytuj kod]

Jeżeli mamy potencjalnych zmiennych objaśniających, to liczba wszystkich kombinacji jest równa

Indywidualna pojemność nośników informacji[edytuj | edytuj kod]

Dla wszystkich otrzymanych kombinacji definiujemy tzw. Indywidualną pojemność nośników informacji, która określona jest wzorem:

gdzie:

– numer kombinacji
– liczba zmiennych w -tej kombinacji,
– numer zmiennej w rozpatrywanej kombinacji,
współczynnik korelacji potencjalnej zmiennej objaśniającej o numerze j ze zmienną objaśnianą (element wektora ),
– współczynnik korelacji między -tą i -tą potencjalną zmienną objaśniającą (element macierzy ).

Wskaźnik mierzy wielkość informacji jaką wnosi zmienna o zmiennej objaśnianej w -tej kombinacji. W związku z tym wzrasta, jeżeli współczynnik korelacji wzrasta, a maleje im bardziej zmienna jest skorelowana z pozostałymi zmiennymi objaśniającymi.

Pojemność integralna kombinacji nośników informacji[edytuj | edytuj kod]

Dopiero, gdy policzymy indywidualną pojemność nośników informacji dla wszystkich kombinacji, możemy obliczyć pojemność integralną kombinacji nośników informacji według wzoru:

gdzie:

– numer kombinacji
– liczba zmiennych w -tej kombinacji,
– numer zmiennej w rozpatrywanej kombinacji.

Pojemność integralna kombinacji nośników informacji dla -tej kombinacji jest sumą indywidualnych pojemności nośników informacji, które wchodzą w skład tej kombinacji. Jest ona kryterium wyboru odpowiedniej kombinacji zmiennych objaśniających, a wybieramy tę kombinację, gdzie jest największa. Ze względu na znacząca liczbę kombinacji zmiennych, które należy porównać skonstruowana została metoda wykorzystująca kryterium Hellwiga w postaci zadania programowania binarnego, w którym licznik z kryterium Hellwiga jest funkcją celu, a mianownik jest podstawą do zbudowania warunków ograniczających.

Przykład[edytuj | edytuj kod]

Dane są:

  • zmienna endogeniczna
  • zbiór potencjalnych zmiennych objaśniających
  • wektor współczynników korelacji liniowej między zmiennymi egzogenicznymi i zmienną endogeniczną
  • macierz współczynników korelacji między potencjalnymi zmiennymi objaśniającymi,

Liczba możliwych kombinacji zmiennych endogenicznych wynosi

  • Kombinacje jednoelementowe:
  • Kombinacje dwuelementowe:
  • Kombinacje trójelementowe:

Bibliografia[edytuj | edytuj kod]

  • A. Barczak, J. Biolik, Podstawy ekonometrii, Wydawnictwo AE Katowice, Katowice 2003, ISBN 83-87265-87-X.
  • J. Dziechciarz, Ekonometria. Metody, przykłady, zadania, Wydawnictwo AE we Wrocławiu, Wrocław 2002, ISBN 83-7011-551-9.
  • M. Rocki, Własność koincydencji i zmienne katalityczne w doborze zmiennych objaśniających za pomocą zadania programowania zerojedynkowego, „Przegląd Statystyczny” 1/2, Warszawa 2000, ISBN 83-7225-073-1.