Wyszukiwanie binarne

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj
Wyszukiwanie binarne
Rodzaj Podstawowy algorytm wyszukiwania
Struktura danych Tablica
Złożoność
Czasowa O(log2n)
Pamięciowa O(1)

Wyszukiwanie binarne jest algorytmem opierającym się na metodzie dziel i zwyciężaj, który w czasie logarytmicznym stwierdza, czy szukany element znajduje się w uporządkowanej tablicy i jeśli się znajduje, podaje jego indeks. Np. jeśli tablica zawiera milion elementów, wyszukiwanie binarne musi sprawdzić maksymalnie 20 elementów (\log_2{1\,000\,000} \approx 20) w celu znalezienia żądanej wartości. Dla porównania wyszukiwanie liniowe wymaga w najgorszym przypadku przejrzenia wszystkich elementów tablicy.

Zasada działania algorytmu[edytuj | edytuj kod]

Uporządkowana tablica jest dzielona na coraz mniejsze przedziały do momentu, gdy przedział osiągnie długość jeden, kiedy możemy jednym sprawdzeniem określić, czy element znajduje się w tablicy.

W pojedynczym kroku rozważa się jeden przedział charakteryzowany dwoma indeksami: początkowym a i końcowym b. Algorytm rozpoczyna wyszukiwanie od całej tablicy.

Następnie wyznaczany jest środek tego przedziału c = \left\lfloor\frac{a+b}{2}\right\rfloor.

Przedział jest zawężany - dzięki uporządkowaniu danych wiadomo, że albo poszukiwany element może znajdować się w indeksach [a; c] albo za nim. Innymi słowy wybór ogranicza się do przedziału [a, c], gdy poszukiwany element jest mniejszy lub równy zapisanemu pod indeksem c, albo [c+1, b] w przeciwnym razie.

Algorytm kończy się niepowodzeniem, jeśli przedział będzie jednoelementowy, tzn. b = a, a pod indeksem a nie ma poszukiwanej wartości.

Pseudokod[edytuj | edytuj kod]

A := [...]      { n-elementowa tablica uporządkowana }
lewo := 1       { indeks początku przedziału }
prawo := n    { indeks końca przedziału - początkowo cała tablica A }

y := poszukiwana wartość
indeks := pusty

while lewo < prawo do
   begin
      środek := (lewo + prawo) div 2; { dzielenie całkowitoliczbowe }
      
      if A[środek] < y then
         lewo := środek + 1
      else
         prawo := środek;
   end;

if A[lewo] = y then
   indeks := lewo
else
   indeks := brak;

Wyszukiwanie interpolacyjne[edytuj | edytuj kod]

Wariant wyszukiwania binarnego, w którym punkt podziału (indeks c) jest wyznaczany metodą interpolacji liniowej.

Jeśli wartości kluczy na krańcach przedziału wynoszą X_a i X_b i poszukiwana wartość X_a \le X \le X_b, wówczas indeks można wyznaczyć jako c = \lfloor a + t \cdot (b-a) \rfloor, gdzie parametr t wynika z wartości kluczy: t = \frac{X - X_a}{X_b - X_a}.

Algorytm charakteryzuje o wiele lepsza średnia złożoność obliczeniowa niż zwykłego wyszukiwania binarnego, wynosi bowiem \Theta(\log \log n), a nie O(\log n). Ta złożoność jest osiągana tylko dla danych mających rozkład jednostajny, w przypadku pesymistycznym jest jednak liniowa. Jak podaje Knuth, testy empiryczne wykazują, że podejście to dobrze sprawdza się dla bardzo dużych rozmiarów tablic, dla niewielkich nie widać wyraźnej przewagi ze względu na bardziej złożone wyliczanie indeksu c.

Pomysłodawcą metody był W.W. Peterson, została użyta do wyszukiwania w posortowanych plikach; została ona opracowana ok. 1957 roku.

Zobacz też[edytuj | edytuj kod]

Bibliografia[edytuj | edytuj kod]

  • Donald Knuth, Sztuka programowania. Tom III: Sortowanie i wyszukiwanie, WNT 2002
  • W. W. Peterson. dressing for Random-Access Storage. „IBM Journal of Research and Development”. 1 (4), s. 130-146, 1957.