Wyszukiwanie binarne

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj
Wyszukiwanie binarne
Rodzaj Podstawowy algorytm wyszukiwania
Struktura danych Tablica
Złożoność
Czasowa O(log2n)
Pamięciowa O(1)

Wyszukiwanie binarne jest algorytmem opierającym się na metodzie dziel i zwyciężaj, który w czasie logarytmicznym stwierdza, czy szukany element znajduje się w uporządkowanej tablicy i jeśli się znajduje, podaje jego indeks. Np. jeśli tablica zawiera milion elementów, wyszukiwanie binarne musi sprawdzić maksymalnie 20 elementów (\log_2{1\,000\,000} \approx 20) w celu znalezienia żądanej wartości. Dla porównania wyszukiwanie liniowe wymaga w najgorszym przypadku przejrzenia wszystkich elementów tablicy.

Zasada działania algorytmu[edytuj | edytuj kod]

Uporządkowana tablica jest dzielona na coraz mniejsze przedziały do momentu, gdy szukany element zostanie znaleziony, bądź przedział osiągnie długość zero, co oznacza brak elementu.

W pojedynczym kroku rozważa się jeden przedział charakteryzowany dwoma indeksami: początkowym a i końcowym b. Algorytm rozpoczyna wyszukiwanie od całej tablicy.

Następnie wyznaczany jest środek tego przedziału c = \left\lfloor\frac{a+b}{2}\right\rfloor. Wówczas testowane jest, czy element zapisany pod indeksem c jest tym poszukiwanym — jeśli tak, to algorytm w tym miejscu kończy działanie.

W przeciwnym razie przedział jest zawężany - dzięki uporządkowaniu danych wiadomo, że albo poszukiwany element może znajdować się gdzieś przed indeksem c albo za nim. Innymi słowy wybór ogranicza się do przedziału [a, c-1], gdy poszukiwany element jest mniejszy od zapisanego pod indeksem c, albo [c+1, b] w przeciwnym razie.

Algorytm kończy się niepowodzeniem, jeśli przedział będzie pusty, tzn. b < a (lewy koniec przedziału "znajdzie się" za prawym końcem).

Pseudokod[edytuj | edytuj kod]

A := [...]      { n-elementowa tablica uporządkowana }
lewo := 0       { indeks początku przedziału }
prawo := n-1    { indeks końca przedziału - początkowo cała tablica A }
 
y := poszukiwana wartość
indeks := pusty
 
while lewo <= prawo do
   begin
      środek := (lewo + prawo)/2; { dzielenie całkowitoliczbowe }
      x := A[środek];
 
      if x = y then
         begin
             { znaleziono poszukiwany element }
             indeks := środek;
             break;
         end;
 
      { w przeciwnym razie przedział jest zawężany, }
      { a poszukiwanie kontynuowane }
      if x < y then
         lewo := środek + 1;
      else
         prawo := środek - 1;
   end;

Wyszukiwanie interpolacyjne[edytuj | edytuj kod]

Wariant wyszukiwania binarnego, w którym punkt podziału (indeks c) jest wyznaczany metodą interpolacji liniowej.

Jeśli wartości kluczy na krańcach przedziału wynoszą X_a i X_b i poszukiwana wartość X_a \le X \le X_b, wówczas indeks można wyznaczyć jako c = \lfloor a + t \cdot (b-a) \rfloor, gdzie parametr t wynika z wartości kluczy: t = \frac{X - X_a}{X_b - X_a}.

Algorytm charakteryzuje o wiele lepsza średnia złożoność obliczeniowa niż zwykłego wyszukiwania binarnego, wynosi bowiem \Theta(\log \log n), a nie O(\log n). Ta złożoność jest osiągana tylko dla danych mających rozkład jednostajny, w przypadku pesymistycznym jest jednak liniowa. Jak podaje Knuth, testy empiryczne wykazują, że podejście to dobrze sprawdza się dla bardzo dużych rozmiarów tablic, dla niewielkich nie widać wyraźnej przewagi ze względu na bardziej złożone wyliczanie indeksu c.

Pomysłodawcą metody był W.W. Peterson, została użyta do wyszukiwania w posortowanych plikach; została ona opracowana ok. 1957 roku.

Zobacz też[edytuj | edytuj kod]

Bibliografia[edytuj | edytuj kod]

  • Donald Knuth, Sztuka programowania. Tom III: Sortowanie i wyszukiwanie, WNT 2002
  • W. W. Peterson. dressing for Random-Access Storage. „IBM Journal of Research and Development”. 1 (4), s. 130-146, 1957.