Mowa (językoznawstwo): Różnice pomiędzy wersjami

[wersja przejrzana]

Usunięta treść Dodana treść

Jednokolumnowy

Wersja z 00:05, 20 cze 2021

Produkcja mowy (język angielski) obrazowana przy użyciu obrazowania metodą rezonansu magnetycznego w czasie rzeczywistym

Mowa, mówienie – używanie języka w procesie porozumiewania się, czyli konkretne akty użycia systemu językowego (złożonego ze znaków i reguł).

Celem mowy jest odbieranie i nadawanie komunikatów w formie przekazów językowych:

Mowa spełnia funkcje:

ekspresyjną – przekazywanie uczuć,
komunikacyjną – informowanie o tym, co znamy, widzieliśmy, słyszeliśmy,
regulacyjną – wydawanie i przyjmowanie dyspozycji.

Fizjologia mózgu

Przetwarzanie mowy jest skomplikowanym procesem i odbywa się w wielu częściach mózgu. Pomimo długoletnich badań dokładne zrozumienie tego procesu jest nadal trudne^[1]. Jednymi z pierwszych badaczy zajmującymi się tymi zagadnieniami byli Carl Wernicke i Paul Broca.

Technika dźwiękowa

Mowa jest sygnałem quasi-stacjonarnym. Za jej zakres częstotliwości przyjmuje się najczęściej 300Hz – 3kHz (w telefonii), jednakże w wielu wypadkach sygnał mowy może mieć częstotliwości do 8 kHz. Zakres zależy od cech osobniczych mówiącego oraz języka. Język polski relatywnie często korzysta z fonemów o wysokich częstotliwościach, np. „sz” i „ś”. W sygnale mowy wyróżniamy jednostki podstawowe – fonemy (w języku polskim występuje ich 38). Fonemy nie zawsze są oddzielone chwilami ciszy, co więcej występuje zjawisko wzajemnego modyfikowania i nakładania się sąsiadujących fonemów – koartykulacja^[2].

Wraz z rozwojem technik informacyjnych, możliwe stało się automatyczne przetwarzanie mowy: synteza, rozpoznawanie i rozumienie, co pozwoliło na opracowanie automatycznych systemów dialogowych. Zadanie rozpoznawania mowy okazało się trudniejsze niż spodziewano się podejmując pierwsze prace nad rozwiązaniem tego problemu. Skuteczność automatycznego rozpoznawania mowy wciąż jest niższa od osiąganej przez człowieka. Wymaga bowiem przeprowadzenia analizy nie tylko na poziomie akustycznym, ale również zaangażowania wiedzy lingwistycznej i semantycznej – w prawidłowym rozpoznaniu pomaga człowiekowi umiejętność domyślania się poszczególnych słów na podstawie kontekstu wypowiedzi, logiki i wiedzy o świecie. Aby maszynowe rozpoznawanie było równie skuteczne, elementy te powinny być wbudowane w algorytm rozpoznawania. Obecnie systemy automatycznego rozpoznawania i syntezy mowy stosowane są z powodzeniem do sterowania urządzeniami, dyktowania tekstów, dostępu do baz danych.

Zobacz też

Przypisy

↑ Hickok, G., & Poeppel, D. (2007). The cortical organization of speech processing. Nature reviews. Neuroscience, 8, 393–402.
↑ B.B. Ziółko B.B., M.M. Ziółko M.M., Przetwarzanie mowy, Wydawnictwa AGH, 2012 .

[1] Hickok, G., & Poeppel, D. (2007). The cortical organization of speech processing. Nature reviews. Neuroscience, 8, 393–402.

[przetwarzaniemowy-2] B.B. Ziółko B.B., M.M. Ziółko M.M., Przetwarzanie mowy, Wydawnictwa AGH, 2012 .

[1]

[2]

@@ Linia 1: / Linia 1: @@
 {{Inne znaczenia|konkretnych aktów użycia języka|[[mowa|inne znaczenia słowa „mowa”]]}}
 [[Plik:Real-time MRI - Speaking (English).ogv|thumb|Produkcja mowy ([[język angielski]]) obrazowana przy użyciu [[Obrazowanie metodą rezonansu magnetycznego w czasie rzeczywistym|obrazowania metodą rezonansu magnetycznego w czasie rzeczywistym]]]]
-'''Mowa''', '''mówienie''' – używanie [[Język (mowa)|języka]] w procesie [[komunikacja językowa|porozumiewania się]], czyli konkretne akty użycia [[system językowy|systemu językowego]] (złożonego ze [[Znak (semiotyka)|znaków]] i [[Reguła językowa|reguł]]).
+'''Mowa''', '''mówienie''' – używanie [[Język (mowa)|języka]] w procesie [[komunikacja językowa|porozumiewania się]], czyli konkretne akty użycia [[system językowy|systemu językowego]] (złożonego ze [[Znak (semiotyka)|znaków]] i [[Zasada językowa|reguł]]).
 Celem mowy jest odbieranie i nadawanie [[komunikat]]ów w formie przekazów [[Język (mowa)|językowych]]:
@@ Linia 18: / Linia 18: @@
 == Technika dźwiękowa ==
-Mowa jest [[sygnał]]em ''quasi-stacjonarnym''. Za jej zakres [[częstotliwość|częstotliwości]] przyjmuje się najczęściej 300Hz - 3kHz (w [[telefonia|telefonii]]), jednakże w wielu wypadkach [[sygnał]] mowy może mieć częstotliwości do 8 kHz. Zakres zależy od cech osobniczych mówiącego oraz języka. Język polski relatywnie często korzysta z fonemów o wysokich częstotliwościach, np. „sz” i „ś”. W sygnale mowy wyróżniamy jednostki podstawowe – [[fonem]]y (w [[Język polski|języku polskim]] występuje ich 38). Fonemy nie zawsze są oddzielone chwilami [[Cisza (akustyka)|ciszy]], co więcej występuje zjawisko wzajemnego modyfikowania i nakładania się sąsiadujących fonemów – [[koartykulacja]]<ref name="przetwarzaniemowy">{{Cytuj|url=http://przetwarzaniemowy.pl/|autor=B. Ziółko; [[Mariusz Ziółko|M. Ziółko]]|tytuł=Przetwarzanie mowy|wydawca= Wydawnictwa AGH|data=2012}}</ref>.
+Mowa jest [[sygnał]]em ''quasi-stacjonarnym''. Za jej zakres [[częstotliwość|częstotliwości]] przyjmuje się najczęściej 300Hz – 3kHz (w [[telefonia|telefonii]]), jednakże w wielu wypadkach sygnał mowy może mieć częstotliwości do 8 kHz. Zakres zależy od cech osobniczych mówiącego oraz języka. Język polski relatywnie często korzysta z fonemów o wysokich częstotliwościach, np. „sz” i „ś”. W sygnale mowy wyróżniamy jednostki podstawowe – [[fonem]]y (w [[Język polski|języku polskim]] występuje ich 38). Fonemy nie zawsze są oddzielone chwilami ciszy, co więcej występuje zjawisko wzajemnego modyfikowania i nakładania się sąsiadujących fonemów – [[koartykulacja]]<ref name="przetwarzaniemowy">{{Cytuj |url = http://przetwarzaniemowy.pl/ |autor = B. Ziółko; [[Mariusz Ziółko|M. Ziółko]] |tytuł = Przetwarzanie mowy |wydawca = Wydawnictwa AGH |data = 2012}}</ref>.
 Wraz z rozwojem [[technika|technik]] informacyjnych, możliwe stało się automatyczne przetwarzanie mowy: synteza, rozpoznawanie i rozumienie, co pozwoliło na opracowanie automatycznych systemów dialogowych. Zadanie rozpoznawania mowy okazało się trudniejsze niż spodziewano się podejmując pierwsze prace nad rozwiązaniem tego problemu. Skuteczność automatycznego rozpoznawania mowy wciąż jest niższa od osiąganej przez człowieka. Wymaga bowiem przeprowadzenia analizy nie tylko na poziomie [[akustyka|akustycznym]], ale również zaangażowania wiedzy [[językoznawstwo|lingwistycznej]] i [[semantyka (językoznawstwo)|semantycznej]] – w prawidłowym rozpoznaniu pomaga człowiekowi umiejętność domyślania się poszczególnych [[słowo|słów]] na podstawie [[kontekst]]u wypowiedzi, [[logika|logiki]] i [[wiedza|wiedzy]] o [[Ziemia|świecie]]. Aby maszynowe rozpoznawanie było równie skuteczne, elementy te powinny być wbudowane w [[algorytm]] rozpoznawania. Obecnie systemy automatycznego rozpoznawania i [[Synteza mowy|syntezy mowy]] stosowane są z powodzeniem do sterowania urządzeniami, dyktowania tekstów, dostępu do [[Baza danych|baz danych]].
@@ Linia 25: / Linia 25: @@
 * [[spektrogram]]
 * [[język mówiony]]
 * [[langue a parole]]
 == Przypisy ==