Słownictwo kontrolowane

Z Wikipedii, wolnej encyklopedii

Słownictwo kontrolowane – zorganizowany zbiór słów i wyrażeń używanych do indeksowania treści i jej wyszukiwania[1]. Zwykle zawiera słownictwo przyjęte oraz warianty odrzucone i ma określony zakres. Zastosowanie słownictwa kontrolowanego poprawia wyniki wyszukiwania[2], a jego implementacja daje dostęp do ustrukturyzowanych zasobów systemu[3]. Kontrolowane słownictwo bywa stawiane w opozycji do niekontrolowanego charakterystycznego dla języka swobodnych słów kluczowych, będącego w istocie wykorzystaniem języka naturalnego w systemach wyszukiwawczych[4].

Cel kontroli słownictwa[edytuj | edytuj kod]

Podstawową zaletą słownictwa kontrolowanego jest to, że dana jednostka leksykalna jest zawsze stosowana w ten sam sposób, np. hasło „I wojna światowa” zostanie zawsze użyte, jeśli dany obiekt cyfrowy będzie odnosił się do tego tematu, mimo iż to samo wyrażenie może zostać zapisane lub nazwane na kilka sposobów (np. „pierwsza wojna światowa”, „1. wojna światowa”, „Wielka Wojna” itd.). Słownictwo wymaga kontroli, gdyż używane standardy podają definicje poszczególnych kategorii informacji oraz ich zawartość, ale przeważnie nie jest precyzowane słownictwo, które powinno zostać użyte. Stosowane zwyczajowe charakterystyki lub instrukcje wyszukiwawcze są często obarczone błędami oraz niekonsekwentnym użyciem terminów[5]. W wypadku języka polskiego ma to przede wszystkim związek z różnorodnością form gramatycznych, fleksją, liczbą możliwych synonimów, homonimów oraz pojęć bliskoznacznych. Komplikacje pojawiają się również z formą zapisu pojęć złożonych. Znaczenie dla używanego słownictwa mają także uwarunkowania historyczne oraz stosowanie języka fachowego[6]. Niespójnie stosowane słownictwo może być wynikiem różnic regionalnych oraz specjalizacji osób, które go używają. W wypadku elementów geograficznych problemem jest często wybór nazwy danej lokalizacji, ponieważ wskutek zmian ustrojowych oraz historycznych, wiele miejsc posiadało w różnych okresach odmienne nazwy. Ze względu na wszystkie te problemy starannie dobrane i dobrze zarządzane słownictwo zebrane w słownikach kontrolowanych może znacznie ułatwić indeksowanie i usprawnić wyszukiwanie treści w zbiorach[7].

Typy słowników słownictwa kontrolowanego[edytuj | edytuj kod]

Istnieje kilka typów słowników kontrolowanych, do których należą[2]:

Lista terminów[edytuj | edytuj kod]

Predefiniowana lista jednoznacznie zdefiniowanych pojęć. Lista taka nie posiada hierarchii haseł, natomiast pomaga ustalić formę wyrazu do użycia w metadanych, co ogranicza liczę możliwych wartości dla danego pola.

Tezaurus[edytuj | edytuj kod]

 Główny artykuł: Tezaurus.

Porządkuje słowa i wyrażenia w sposób hierarchiczny, co umożliwia dostęp tak do pojęć ogólnych, jak i szczegółowych. Zazwyczaj podaje także informację dotyczącą terminów pokrewnych, synonimów oraz haseł preferowanych (który synonim powinien być używany jako pierwszy).

Słownik haseł przedmiotowych[edytuj | edytuj kod]

Hasła przedmiotowe to najbardziej charakterystyczne słowa lub wyrażenia, które oddają istotę przedmiotu lub jeden z tematów opisywanego obiektu[8]. Tak jak w przypadku tezaurusa pojawia się hierarchia pojęć, ale funkcjonuje ona na innej zasadzie. Hasła przedmiotowe mogą być łączone w celu wyrażenia bardziej szczegółowego pojęcia.

Tablice klasyfikacyjne[edytuj | edytuj kod]

 Główny artykuł: Klasyfikacja.

Klasyfikacje są zazwyczaj hierarchiczne, zaczynają się szerokim zakresem przedmiotowym, by następnie dzielić się na zawężone tematy.

Kartoteka haseł wzorcowych[edytuj | edytuj kod]

 Główny artykuł: Kartoteka haseł wzorcowych.

Zawiera informacje o organizacjach, osobach i miejscach ustalonych jako obecnie obowiązujące nazwy własne. Używanie ich pozwala ujednolicić nazwy, do których odnoszą się metadane.

Przykładowe słowniki słownictwa kontrolowanego[edytuj | edytuj kod]

Do przykładowych słownictw kontrolowanych należą m.in.[6]:

Zobacz też[edytuj | edytuj kod]

Przypisy[edytuj | edytuj kod]

  1. Patricia Harping: Introduction to Controlled Vocabularies: Terminology for Art, Architecture, and Other Cultural Works. Getty Publications, 2010. ISBN 978-1-60606-018-6. [dostęp 2020-12-22]. (ang.).
  2. a b Opisywanie obiektów cyfrowych. fbc.pionier.net.pl, 21-10-2016. [dostęp 2020-12-31]. (pol.).
  3. Marcin Roszkowski. Źródła słownictwa kontrolowanego dla dziedzinowych systemów hipertekstowych w Internecie. „Zagadnienia Informacji Naukowej”. 2, s. 31-44, 2005. [dostęp 2020-12-22]. 
  4. Wiesław Babik: Kontrola słów kluczowych w indeksowaniu i wyszukiwaniu informacji. W: Z zagadnień informacji naukowej, terminoznawstwa i językoznawstwa. Paweł Kowalski (red.). Warszawa: Instytut Slawistyki Polskiej Akademii Nauk, 2018, s. 9-24. ISBN 978-83-64031-83-0.
  5. Marcin Kłos, Katarzyna Zielonka: Strukturyzacja języka opisu. Doświadczenia Międzymuzealnej Grupy ds. Digitalizacji DigiMuz. W: Dobra kultury w Sieci. Cyfrowe spotkania z zabytkami 3. E. Herden, A. Seidel-Grzesińska i K. Stanicka-Brzezicka (red.). Wrocław: 2012, s. 111-120.
  6. a b Kontrola słownictwa. W: Metadane, zagadnienia słowników kontrolowanych. Łukasz Gaweł (red.). Warszawa: Narodowy Instytut Muzealnictwa i Ochrony Zbiorów, 2012, s. 43-64. ISBN 978-83-933790-6-4. [dostęp 2020-12-22].
  7. Controlling your Language: a Directory of Metadata Vocabularies. www.jiscdigitalmedia.ac.uk. [dostęp 2020-12-31]. [zarchiwizowane z tego adresu (01-01-2016)]. (ang.).
  8. Subject Heading. www.librarianshipstudies.com, 03-07-2019. [dostęp 2020-12-31]. (ang.).