Rozkład Benforda
Rozkład Benforda to rozkład prawdopodobieństwa występowania określonej pierwszej cyfry w wielu rzeczywistych danych statystycznych, np. dotyczących powierzchni jezior w Polsce, danych z rocznika statystycznego, wartościach stałych fizycznych. Ogólnie rozkład ten sprawdza się w przypadku wielkości, które mogą przyjmować różne rzędy wielkości. Fakt częstego występowania tego rozkładu w obserwowanych danych zwany jest prawem Benforda.
Prawdopodobieństwo wystąpienia cyfry k to
Rozkład ten został po raz pierwszy zaobserwowany przez amerykańskiego astronoma Simona Newcomba w 1881 roku, a ponownie odkryty przez Franka Benforda w 1938. Dowód twierdzenia podał w 1995 roku Theodore Hill[1].
Rozkład Benforda jest stosowany do sprawdzania poprawności zeznań podatkowych bądź defraudacji, gdyż ludzie wpisując liczby tak, żeby wydawały się przypadkowe, nie są świadomi, że pewne cyfry występują częściej na pierwszej pozycji.
Częstotliwości występowania cyfr na pierwszej pozycji są przedstawione w tabeli poniżej.
| Pierwsza cyfra | Częstość |
|---|---|
| 1 | 30,1% |
| 2 | 17,6% |
| 3 | 12,5% |
| 4 | 9,7% |
| 5 | 7,9% |
| 6 | 6,7% |
| 7 | 5,8% |
| 8 | 5,1% |
| 9 | 4,6% |
Spis treści |
[edytuj] Przykłady zastosowania
[edytuj] Defraudacja Jamesa Nelsona
Zastosowanie rozkładu Benforda pomogło w wykryciu fałszerstw dokonanych przez Jamesa Nelsona, głównego księgowego i zarządzającego Arizona State Treasurer. W 1992 roku w miasteczku Wayne (Arizona, USA) został uznany za winnego zdefraudowania 1 878 687,58 dolarów. Dokonał tego wystawiając 23 fałszywe czeki.
- oszustwo rozpoczęło się małą kwotą (najmniejszą w całej procedurze), przy czym kolejne kwoty fałszywych czeków stopniowo rosły
- większość czeków wystawiono na kwotę poniżej 100 000 dolarów.
- wykrycie przestępstwa umożliwił rozkład pierwszych cyfr poszczególnych kwot.
[edytuj] Wybory prezydenckie w Iranie 2009
Boudewijn F. Roukema z toruńskiego Uniwersytetu Mikołaja Kopernika zaobserwował, iż rozkład pierwszych cyfr liczby głosów oddanych w wyborach w Iranie w 2009 roku w poszczególnych okręgach na kandydata małej partii opozycyjnej Mehdiego Karroubiego nie zgadza się z rozkładem Benforda – wśród pierwszych cyfr dwukrotnie częściej niż powinna pojawia się siódemka (poziom istotności 0,007). Anomalie występują w trzech z sześciu największych okręgów i są to właśnie okręgi w których aktualny prezydent Mahmud Ahmadineżad miał proporcjonalnie wyższe poparcie niż w reszcie kraju[2]. Jednakże statystycy Nate Silver[3] i Andrew Gelman[4] wyrazili sceptycyzm w kwestii znaczenia tego wyniku.
[edytuj] Źródła
- Roman Nowak, Statystyka dla fizyków, Warszawa: PWN, 2002, ISBN 83-01-13702-9
Przypisy
- ↑ Hill Theodore. A Statistical Derivation of the Significant-Digit Law. „Statistical Science”. 10, s. 354-363, 1995. Institute of Mathematical Statistics (ang.).
- ↑ Boudewijn F. Roukema: Benford's Law anomalies in the 2009 Iranian presidential election. [dostęp 27 czerwca 2009].
- ↑ Nate Silver. Karroubi's Unlucky 7's?. „fivethirtyeight.com”, 18 czerwca 2009.
- ↑ Andrew Gelman. Unconvincing (to me) Use of Benford's Law to Demonstrate Election Fraud in Iran. „fivethirtyeight.com”, 18 czerwca, 2009.
[edytuj] Zobacz też
