Asymptotyczne tempo wzrostu

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Asymptotyczne tempo wzrostu jest miarą określającą zachowanie wartości funkcji wraz ze wzrostem jej argumentów. Stosowane jest szczególnie często w teorii obliczeń, w celu opisu złożoności obliczeniowej, czyli zależności ilości potrzebnych zasobów (np. czasu lub pamięci) od rozmiaru danych wejściowych algorytmu. Asymptotyczne tempo wzrostu opisuje jak szybko dana funkcja rośnie lub maleje, abstrahując od konkretnej postaci tych zmian.

Do opisu asymptotycznego tempa wzrostu stosuje się notację dużego O oraz jej modyfikacje, m.in. notacja \Omega (duża omega), \Theta (theta).

Notacja dużego O została zaproponowana po raz pierwszy w roku 1894 przez niemieckiego matematyka Paula Bachmanna[1]. W późniejszych latach spopularyzował ją w swoich pracach Edmund Landau, niemiecki matematyk, stąd czasem nazywana jest notacją Landaua.

Definicje analityczne[edytuj | edytuj kod]

Niech będą dane funkcje f oraz g, których dziedziną jest zbiór liczb naturalnych, natomiast przeciwdziedziną zbiór liczb rzeczywistych dodatnich.

Notacja "duże O"[edytuj | edytuj kod]

Mówimy, że f jest co najwyżej rzędu g, gdy istnieją takie stałe n_0 >0\;, oraz c>0\;, że:


\begin{matrix}
\forall n \geqslant n_0 : & f(n) \leqslant c \cdot g(n) \\
\end{matrix}

Zapis: f(n) \in O(g(n))\;

Określenia "złożoność co najwyżej O(f(n))" i "złożoność O(f(n))" są matematycznie równoważne.

Wersja notacji dla zachowania się funkcji w pobliżu punktu a:

f(n) \in O(g(n))\;, jeżeli istnieje takie c>0\, i takie \delta > 0\;, że dla każdego x\; o tej własności, że |x-a|<\delta\; zachodzi nierówność

|f(x)| \leqslant c \cdot |g(x)|.

Należy zauważyć, że nie precyzuje się tu dziedziny funkcji f i g – zależy ona od kontekstu w jakim występują obie funkcje.

Notacja "małe o"[edytuj | edytuj kod]

Mówimy, że f jest niższego rzędu niż g, gdy dla każdej stałej c>0\; istnieje stała n_0 > 0\;, że:


\begin{matrix}
\forall n \geqslant n_0 : & f(n) < c \cdot g(n) \\
\end{matrix}

Zapis: f(n) \in o(g(n))\;

Notacja "Ω"[edytuj | edytuj kod]

Mówimy, że f jest co najmniej rzędu g, gdy istnieją takie stałe n_0 >0\;, oraz c>0\;, że:


\begin{matrix}
\forall n \geqslant n_0 : & f(n) \geqslant c \cdot g(n) \\
\end{matrix}

Zapis: f(n) \in \Omega(g(n))\;

Notacja "ω"[edytuj | edytuj kod]

Mówimy, że f jest wyższego rzędu niż g, gdy dla każdej stałej c>0\; istnieje stała n_0 > 0\;, że:


\begin{matrix}
\forall n \geqslant n_0 : & f(n) > c \cdot g(n) \\
\end{matrix}

Zapis: f(n) \in \omega(g(n))\;

Notacja "Θ"[edytuj | edytuj kod]

Mówimy, że f jest dokładnie rzędu g, gdy istnieją takie stałe n_0 >0\;, oraz c_1>0\; i c_2>0, że:


\begin{matrix}
\forall n \geqslant n_0 : & c_1 \cdot g(n) \leqslant f(n) \leqslant c_2 \cdot g(n) \\
\end{matrix}

Zapis: f(n) \in \Theta(g(n))\;

Można powiedzieć, że f(n) \in \Theta(g(n))\;, gdy f(n)\; jest jednocześnie rzędu O(g(n))\; i \Omega(g(n))\;.

Uwagi[edytuj | edytuj kod]

Notacja dużego O pozwala wykonywać działania na funkcjach, na przykład:

  • jeśli f(x) \in O(r(x))\; i g(x) \in O(r(x))\;, to również f(x) \pm g(x) \in O(r(x)).
  • przy założeniach jak poprzednio, f(x) \cdot g(x) \in O(r^2(x))

Wygoda notacji dużego O widoczna jest w następującej sytuacji: jeżeli f(x) = 2x^3-x^2+100x\;, to można napisać zarówno f(x) \in O(x^3)\;, jak i f(x) \in 2x^3+O(x^2)\;, czy wreszcie f(x) \in 2x^3-x^2+O(x)\;, zależnie od wymaganej dokładności oszacowań.

Napis g(x) \in f(x)+O(h(x))\, należy rozumieć jako g(x)-f(x) \in O(h(x))\,.

Zależności algebraiczne O, o, Ω, ω, Θ[edytuj | edytuj kod]

Notacja Warunek wystarczający
f(x) \in O(g(x))\; \lim_{x \to \infty} \left|\frac{f(x)}{g(x)}\right| < \infty
f(x) \in o(g(x))\; \lim_{x \to \infty} \frac{f(x)}{g(x)} = 0
f(x) \in \Omega(g(x))\; \lim_{x \to \infty} \left|\frac{f(x)}{g(x)}\right| > 0
f(x) \in \omega(g(x))\; \lim_{x \to \infty} \frac{f(x)}{g(x)} = \infty
f(x) \in \Theta(g(x))\; 0 < \lim_{x \to \infty} \left|\frac{f(x)}{g(x)}\right| < \infty

Przykłady[edytuj | edytuj kod]

  • Jeżeli f(x)=1000x^{50}+2x^2\; oraz g(x)=0,0000001x^{50}+665x\;, to f(x) \in O(x^{50})\, oraz g(x) \in O(x^{50})\,, ale również g(x) \in O(f(x))\,.
  • Niech S(n) = 1 + 2 + \cdots + n. Korzystając ze wzorów sumacyjnych: S(n)=\frac{n(n+1)}{2} < 3 \cdot n^2, a zatem S(n) \in O(n^2)\,.
  • Jeżeli potrzebne jest dokładniejsze oszacowanie S(n)\,, to na podstawie tego samego wzoru sumacyjnego można napisać S(n)= \frac{n^2}{2} + \frac{n}{2} \in \frac{n^2}{2}+O(n).
  • Analogicznie można napisać, że 1^2 + 2^2 + \cdots + n^2 \in O(n^3).

Standardowe oszacowania[edytuj | edytuj kod]

W zastosowaniach szczególnie często notacja O-duże pojawia się w następujących sytuacjach:

Rząd złożoności obliczeniowej[edytuj | edytuj kod]

W zależności od asymptotycznego tempa wzrostu, funkcje dzieli się na rzędy złożoności obliczeniowej. Najczęściej wyróżnia się:

1\; stała
\log n\; logarytmiczna
n\; liniowa
n \log n\; liniowo-logarytmiczna (lub quasi-liniowa)
n^2\; kwadratowa
n^c\; wielomianowa
c^n\; wykładnicza

Zastosowanie[edytuj | edytuj kod]

Najczęstszym zastosowaniem asymptotycznego tempa wzrostu jest szacowanie złożoności problemów obliczeniowych, w szczególności algorytmów. Oszacowanie rzędów złożoności obliczeniowej funkcji pozwala na porównywanie ilości zasobów (np. czasu, pamięci), jakich wymagają do rozwiązania problemu opisanego określoną ilością danych wejściowych. W dużym uproszczeniu można powiedzieć, że im niższy rząd złożoności obliczeniowej algorytmu, tym będzie on wydajniejszy przy coraz większym rozmiarze problemu (np. ilości danych do algorytmu).

W praktyce na efektywność algorytmu wpływa duża ilość innych czynników, w tym szczegóły realizacji. Ponadto dla małych danych wejściowych asymptotyczne tempo wzrostu może nie oddawać zachowania funkcji - np. gdy f(n) = \frac{n}{1000} (funkcja liniowa \Theta(n)\;) i g(n) = \log n\; (funkcja logarytmiczna \Theta(\log n)\;), zachodzi oszacowanie f(n) \in \omega(g(n))\; (f(n)\; asymptotycznie rośnie szybciej niż g(x)\;), ale dla n=10\; wartość funkcji f jest mniejsza niż funkcji g.

Istnieje również wiele sytuacji kiedy algorytm ma lepszą złożoność obliczeniową niż inne, ale nie stosuje się go, ponieważ jego przewaga w faktycznej implementacji jest widoczna dopiero dla gigantycznych (i kompletnie niepraktycznych) wielkości wejścia, lub ma inne wady (na przykład niestabilność numeryczną, porównaj Algorytm Strassena). Innym powodem może być na przykład fakt, że algorytm ma lepszą złożoność czasową, ale gorszą złożoność pamięciową i vice-versa (tzw. space-memory tradeoff).

Zobacz też[edytuj | edytuj kod]

Przypisy

  1. Ronald L Graham, Donald Ervin Knuth, Oren Patashnik: Matematyka konkretna. Warszawa: Wydawnictwo Naukowe PWN, 2002, s. 489. ISBN 83-01-13906-4.