Wyszukiwanie głosowe

Z Wikipedii, wolnej encyklopedii
Przejdź do nawigacji Przejdź do wyszukiwania
Ikona wyszukiwania głosowego Google
Ikona wyszukiwania głosowego Google

Wyszukiwanie głosowe[1] – narzędzie, które pozwala użytkownikowi na użycie polecenia głosowego do przeszukiwania Internetu lub urządzenia. Technologia ta ma zastosowanie na urządzeniach mobilnych oraz komputerach.

Historia[edytuj | edytuj kod]

Implementacja Google[edytuj | edytuj kod]

Wyszukiwanie głosowe jako narzędzie od Google pozwala użytkownikowi na wykorzystanie mikrofonu w telefonie do tworzenia zapytań w wyszukiwarce. Początkowo, aby uruchomić narzędzie należało wpisać numer (650) 623-6706, następnie użytkownik oczekiwał na słowa "Wypowiedz swoje kluczowe słowa" (ang. Say your Search Keywords), po usłyszeniu których mógł wypowiedzieć frazę, którą chciał znaleźć. Narzędzie aktualizowało stronę lub generowało link do strony wyszukiwania z zapytaniem użytkownika. Od kiedy Google zaczęło używać technologii rozpoznawania mowy takich jak GOOG-411[2], wersje z użyciem numeru telefonu zostały dezaktywowane.

Implementacja Apple[3][edytuj | edytuj kod]

Firma Apple wprowadziła w Lutym 2010 roku swoje rozwiązanie wyszukiwania głosowego wydając aplikacje,o nazwie Siri[4], na urządzenia z systemem iOS. Oprogramowanie opiera się na interfejsie konwersacyjnym - rozpoznaje naturalną mowę użytkownika , odpowiada na jego pytania oraz wykonuje powierzone mu zadania. Dzięki zastosowaniu nauczania maszynowego asystent analizuje osobiste preferencje użytkownika, dzięki czemu zapewnienia bardziej dopasowane wyniki. Siri zadebiutowała wraz z systemem operacyjnym iOS 5, 4 października 2011 roku podczas konferencji „Let's Talk iPhone”.

Zastosowanie[5][edytuj | edytuj kod]

  1. Wyszukiwanie haseł o trudnej pisowni
  2. Wyszukiwanie dłuższych haseł
  3. Hasła, które wygodniej jest wyszukać na głos
  4. Wyszukiwanie bez pisania

Wspierane języki[edytuj | edytuj kod]

Języki znajdujące się na liście są aktualnie w całości lub częściowo wspierane przez narzędzie wyszukiwania głosowego.

Język Rok wprowadzenia
Afrikaans 2010
Amharski 2017
Armeński 2017
Azerski 2017
Baskijski 2012
Bengalski 2017
Bułgarski 2012
Kataloński 2012
Czeski 2010
Duński 2014
Niderlandzki 2010
Angielski 2008
Filipiński 2013
Fiński 2012
Francuski 2010
Galicyjski 2012
Gruziński 2017
Niemiecki 2010
Gudźarati 2017
Hebrajski 2011
Węgierski 2012
Islandzki 2012
Włoski 2010
Indonezyjski 2011
Japoński 2009
Jawajski 2017
Kanadyjski 2017
Koreański 2010
Khmerski 2017
Laotański 2017
Łacina 2017
Łotewski 2017
Litewski 2015
Mandaryński 2009
Malajski 2011
Malajalam 2017
Marathi 2017
Nepalski 2017
Norweski 2012
Perski 2013
Polski 2010
Portugalski 2012
Rumuński 2012
Rosyjski 2010
Serbski 2012
Syngaleski 2017
Słowacki 2012
Hiszpański 2010
Sundajski 2017
Suahili 2017
Szwedzki 2012
Tamilski 2017
Telugu 2017
Turecki 2010
Urdu 2017
Zulu 2010
Wietnamski 2015

Implementacja wyszukiwania głosowego we własnej aplikacji[edytuj | edytuj kod]

Google pozwala na użycie wyszukiwania głosowego we własnej aplikacji udostępniając API swojej aplikacji[6]. W przypadku Google Voice Search jest to Web Speech API. Implementacja wygląda następująco[7]:

 1 <div>
 2  <a href="#" id="start_button" onclick="startDictation(event)">Dictate</a>
 3 </div>
 4 
 5 <div id="results">
 6  <span id="final_span" class="final"></span>
 7  <span id="interim_span" class="interim"></span>
 8 </div>
 9 
10 <script type="text/javascript">
11 var final_transcript = '';
12 var recognizing = false;
13 
14 if ('webkitSpeechRecognition' in window) {
15 
16  var recognition = new webkitSpeechRecognition();
17 
18  recognition.continuous = true;
19  recognition.interimResults = true;
20 
21  recognition.onstart = function() {
22  recognizing = true;
23  };
24 
25  recognition.onerror = function(event) {
26  console.log(event.error);
27  };
28 
29  recognition.onend = function() {
30  recognizing = false;
31  };
32 
33  recognition.onresult = function(event) {
34  var interim_transcript = '';
35  for (var i = event.resultIndex; i < event.results.length; ++i) {
36  if (event.results[i].isFinal) {
37  final_transcript += event.results[i][0].transcript;
38  } else {
39  interim_transcript += event.results[i][0].transcript;
40  }
41  }
42  final_transcript = capitalize(final_transcript);
43  final_span.innerHTML = linebreak(final_transcript);
44  interim_span.innerHTML = linebreak(interim_transcript);
45  
46  };
47 }
48 
49 var two_line = /\n\n/g;
50 var one_line = /\n/g;
51 function linebreak(s) {
52  return s.replace(two_line, '<p></p>').replace(one_line, '<br>');
53 }
54 
55 function capitalize(s) {
56  return s.replace(s.substr(0,1), function(m) { return m.toUpperCase(); });
57 }
58 
59 function startDictation(event) {
60  if (recognizing) {
61  recognition.stop();
62  return;
63  }
64  final_transcript = '';
65  recognition.lang = 'en-US';
66  recognition.start();
67  final_span.innerHTML = '';
68  interim_span.innerHTML = '';
69 }
70 </script>

Przypisy[edytuj | edytuj kod]

  1. Google Voice Search, Wikipedia, 19 stycznia 2018 [dostęp 2018-02-06] (ang.).
  2. GOOG-411, Wikipedia, 3 lutego 2018 [dostęp 2018-02-06] (ang.).
  3. Siri, Wikipedia, 6 lutego 2018 [dostęp 2018-02-06] (ang.).
  4. Siri: Your Personal Assistant for the Mobile Web - ReadWrite, „ReadWrite”, 4 lutego 2010 [dostęp 2018-02-11] (ang.).
  5. Wyszukiwanie głosowe – Wszystko o wyszukiwaniu – Google, www.google.com [dostęp 2018-02-06] (pol.).
  6. How to Add Speech Recognition to your Website with HTML, www.labnol.org [dostęp 2018-02-11] (ang.).
  7. How to Use the Web Speech API in HTML5, „Web Geek”, 9 marca 2014 [dostęp 2018-02-11] (ang.).

Linki zewnętrzne[edytuj | edytuj kod]