Dopasowanie do wzorca

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Dopasowanie do wzorca to operacja, gdzie pewne wyrażenie sprawdza się ze wzorcem, w którym może znajdować się jedno lub więcej "wolnych miejsc". W wyniku, o ile nastąpiło dopasowanie otrzymuje się listę wyrażeń które dopasowały się do wolnych miejsc wzorca.

Dopasowywanie do wzorca jest bardzo ekspresywną techniką programistyczną. Dwa najpopularniejsze systemy to:

Wyrażenia regularne[edytuj | edytuj kod]

W większości nowych języków wyrażeń regularnych można używać jako wzorców, np (Perl):

if ($numer_ip =~ /^(\d+)\.(\d+)\.(\d+)\.(\d+)$/)
{
    # pasuje do wzorca, kolejne liczby w $1 $2 $3 $4
} else {
    # nie pasuje do wzorca
}

Dopasowywanie to jest jednym z głównych źródeł siły ekspresji i zwięzłości Perla i innych nowych języków (Ruby, PHP, Python itd.) Analogiczny kod w C musiałby korzystać z biblioteki zapewniającej dopasowywane do wzorców (np. PCRE), lub byłby proporcjonalnie gigantyczny, i zarazem mało czytelny i z dużymi szansami na wystąpienie błędów.

Wzorce symboliczne[edytuj | edytuj kod]

W językach funkcyjnych zwykle używa się wzorców symbolicznych - termów ze zmiennymi, które dopasowuje się do danego wyrażenia przez unifikację. Dostępny jest również specjalny symbol uniwersalny, pasujący do każdego obiektu; w wielu językach to znak podkreślenia _.

Na przykład (w Ocamlu) zamiana wartości liczbowej na ciąg znaków z użyciem dopasowania można zrealizować następująco:

match liczba with
     0 -> "zero"
|    1 -> "jeden"
|    2 -> "dwa"
|    _ -> "inna liczba"

To samo można uzyskać instrukcją warunkową:

if liczba = 0 then "zero" else
if liczba = 1 then "jeden" else
if liczba = 2 then "dwa" else "inna liczba"

Jednak zapis jest bardziej rozwlekły i mniej czytelny.

Jeszcze inny przykład wykorzystujący konstruktory list; zapis x::lista oznacza doklejenie na początek listy elementu x, wynikiem jest nowa lista.

match zmienna with
           [] -> "Lista jest pusta"
|       x::[] -> "Lista ma jeden element: " ^ x
|    x::y::[] -> "Lista ma dwa elementy: " ^ x ^ " i " ^ y
| x::y::z::[] -> "Lista ma trzy elementy: " ^ x ^ ", " ^ y ^" i " ^ z
| x::y::z::_  -> "Lista ma więcej niż trzy elementy: " ^ x ^ ", " ^ y ^", " ^ z ^ "..."

Czy też przekształcać symbole w inne wyrażenia (Ocaml, kod z texvc):

let get_encoding = function
    UTF8   -> "\\usepackage{ucs}\n\\usepackage[utf8]{inputenc}\n"
  | LATIN1 -> "\\usepackage[latin1]{inputenc}\n"
  | LATIN2 -> "\\usepackage[latin2]{inputenc}\n"