Metoda Hellwiga
Ten artykuł należy dopracować |
Metoda Hellwiga, zwana również metodą optymalnego wyboru predyktant, metodą wskaźników pojemności informacji – formalna metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona w 1968 roku przez Zdzisława Hellwiga.
Zmienne, które wybieramy do modelu powinny być silnie skorelowane ze zmienną objaśnianą, a słabo skorelowane między sobą. Nie jest to jednak ścisłe kryterium doboru zmiennych, oprócz tego występuje kryterium liczbowe, tzw. pojemność integralna kombinacji nośników informacji. W tym przypadku nośnikami informacji są wszystkie zmienne objaśniające.
Liczba kombinacji[edytuj | edytuj kod]
Jeżeli mamy potencjalnych zmiennych objaśniających, to liczba wszystkich kombinacji jest równa
Indywidualna pojemność nośników informacji[edytuj | edytuj kod]
Dla wszystkich otrzymanych kombinacji definiujemy tzw. Indywidualną pojemność nośników informacji, która określona jest wzorem:
gdzie:
- – numer kombinacji
- – liczba zmiennych w -tej kombinacji,
- – numer zmiennej w rozpatrywanej kombinacji,
- – współczynnik korelacji potencjalnej zmiennej objaśniającej o numerze j ze zmienną objaśnianą (element wektora ),
- – współczynnik korelacji między -tą i -tą potencjalną zmienną objaśniającą (element macierzy ).
Wskaźnik mierzy wielkość informacji jaką wnosi zmienna o zmiennej objaśnianej w -tej kombinacji. W związku z tym wzrasta, jeżeli współczynnik korelacji wzrasta, a maleje im bardziej zmienna jest skorelowana z pozostałymi zmiennymi objaśniającymi.
Pojemność integralna kombinacji nośników informacji[edytuj | edytuj kod]
Dopiero, gdy policzymy indywidualną pojemność nośników informacji dla wszystkich kombinacji, możemy obliczyć pojemność integralną kombinacji nośników informacji według wzoru:
gdzie:
- – numer kombinacji
- – liczba zmiennych w -tej kombinacji,
- – numer zmiennej w rozpatrywanej kombinacji.
Pojemność integralna kombinacji nośników informacji dla -tej kombinacji jest sumą indywidualnych pojemności nośników informacji, które wchodzą w skład tej kombinacji. Jest ona kryterium wyboru odpowiedniej kombinacji zmiennych objaśniających, a wybieramy tę kombinację, gdzie jest największa. Ze względu na znacząca liczbę kombinacji zmiennych, które należy porównać skonstruowana została metoda wykorzystująca kryterium Hellwiga w postaci zadania programowania binarnego, w którym licznik z kryterium Hellwiga jest funkcją celu, a mianownik jest podstawą do zbudowania warunków ograniczających.
Przykład[edytuj | edytuj kod]
Dane są:
- zmienna endogeniczna
- zbiór potencjalnych zmiennych objaśniających
- wektor współczynników korelacji liniowej między zmiennymi egzogenicznymi i zmienną endogeniczną
- macierz współczynników korelacji między potencjalnymi zmiennymi objaśniającymi,
Liczba możliwych kombinacji zmiennych endogenicznych wynosi
- Kombinacje jednoelementowe:
- Kombinacje dwuelementowe:
- Kombinacje trójelementowe:
Bibliografia[edytuj | edytuj kod]
- A. Barczak, J. Biolik, Podstawy ekonometrii, Wydawnictwo AE Katowice, Katowice 2003, ISBN 83-87265-87-X.
- J. Dziechciarz, Ekonometria. Metody, przykłady, zadania, Wydawnictwo AE we Wrocławiu, Wrocław 2002, ISBN 83-7011-551-9.
- M. Rocki, Własność koincydencji i zmienne katalityczne w doborze zmiennych objaśniających za pomocą zadania programowania zerojedynkowego, „Przegląd Statystyczny” 1/2, Warszawa 2000, ISBN 83-7225-073-1.