Stylometria

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Stylometria - metoda analizy dzieła sztuki dla ustalenia statystycznej charakterystyki stylu autora. Służy głównie rozstrzyganiu kwestii autorstwa dzieł anonimowych bądź chronologii przekazu. Założenia stylometrii przedstawił w roku 1890 Wincenty Lutosławski, w pracy "Principes de stylometrie".

Historia[edytuj | edytuj kod]

W 1439 roku Lorenzo Valla udowodnił, że dokument "Donacja Konstantyna" jest falsyfikatem, dowód opierając na porównaniu łaciny tam użytej z dokumentami z epoki. Można to uznać za prapoczątek stylometrii, pierwszy udokumentowany przypadek zastosowania analizy porównawczej dla ustalenia autentyczności. Jednak prawdopodobnie współczesna stylometria bierze swój początek w sugestii Augusta de Morgana, który w 1851 r. postawił tezę, iż możliwa jest identyfikacja autorów tekstów biblijnych na podstawie analizy długości słów używanych przez poszczególnych autorów.

Początkowo stylometria stosowana była do analizy tekstów literackich. Metodę wykorzystał do analizy greckich dzieł Platona. Analiza polegała na ustaleniu liczbowych rozkładów stylemów (elementarnych jednostek językowo-stylistycznych): charakterystycznych słów, zwrotów, wyrażeń, kolokacji oraz form fleksyjnych. W ten sposób ustalono względną chronologię dzieł Platona oraz potwierdzono jego autorstwo w stosunku do jednych a wykluczono je w stosunku do kilku innych dzieł wątpliwych. W późniejszym okresie z sukcesem wykorzystywano analogiczne metody w filologii angielskiej do badania dzieł Szekspira, w filologii klasycznej do okreslania autorstwa ksiąg Nowego Testamentu, przypisywanych św. Pawłowi oraz w orientalistyce - np. w indologii do badania dzieł przypisywanych Śankarze i Patańdżalemu, w arabistyce do badania tekstu Koranu, oraz w sinologii do badania rękopisów z Mawangdui. Badania stylometryczne z użyciem komputerów pozwalają na badanie wielkich korpusów językowych oraz na uzyskanie większej pewności osiągniętych wyników.


Oprogramowanie[edytuj | edytuj kod]

Zastosowanie komputerów umożliwiło także zastosowanie stylometrii do badań utworów muzycznych i malarstwa. Tutaj w ustaleniu charakterystyki stylu wykorzystywane są: analiza fraktalna, analiza głównych składowych, algorytm genetyczny oraz sieci neuronowe.[1] Oprogramowanie takie jak Signature[2] (bezpłatny system opracowany przez Dr Peter Millicana z Oxford University), JGAAP[3] (the Java Graphical Authorship Attribution Program— bezpłatny system opracowany przez Dr Patrick Juola z Duquesne University), czy Stylene opracowany dla jezyka holenderskiego (system opracowany przez Walter Daelemans z University of Antwerp oraz Dr Véronique Hoste z University of Ghent) umożliwia analizę stylometryczną nawet przez osoby nie będące ekspertami w tej dziedzinie. Voyant tools[4] umożliwiają analizę tekstu ze strony sieciowej.

Program stylo[5][6], opracowany przez Macieja Edera, Jana Rybickiego oraz Mike Kestemonta, jest bezpłatnym systemem napisany w języku programowania R umożliwiającym różnorodne analizy stylometryczne, łącznie z atrybucją autora tekstu. Ten program analizuje teksty w róznych językach w szczególności w języku polskim. Stylo ma interfejs graficzny pozwalający na proste użycie programu.

Programy do stylometri potrzebują corpusu, czyli tekstów wejściowych używanych do poszukiwania podobieństw. Przykładem programu do konwersji pomiędzy formatami jest calibre.

Referencje[edytuj | edytuj kod]

  1. Jeremi K. Ochab: Stylometria i atrybucja autorska: co mierzy i dlaczego działa. (ang.). W: Praca magisterska [on-line]. 15 czerwca 2006.
  2. The Signature Stylometric System (ang.). PhiloComp. [dostęp 2014-01-03].
  3. JGAAP (ang.). JGAAP, 2012-09-04. [dostęp 2012-10-15].
  4. Stéfan Sinclair i Geoffrey Rockwell: Voyant Tools, a web-based text analysis and reading environment. (ang.). W: strona sieciowa [on-line]. 2016.
  5. stylo (ang.). CSG, 2014-10-24. [dostęp 2014-10-24].
  6. Maciej Eder, Jan Rybicki, Mike Kestemont: Stylometry with R: A Package for Computational Text Analysis (ang.). W: The R Journal [on-line]. 2015.