Big data

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania
Wizualizacja edycji Wikipedii jako klasyczny przykład big data.

Big data[1] – termin odnoszący się do dużych zbiorów danych, których przetwarzanie wymaga zastosowania specjalistycznego oprogramowania. W praktyce pojęcie dużego zbioru danych oznacza rozmiar wyrażany przy pomocy co najmniej dziesiątek terabajtów, a często nawet petabajtów. Big data ma zastosowanie wszędzie tam, gdzie dużej ilości cyfrowych danych towarzyszy potrzeba zdobywania nowych informacji lub wiedzy. Szczególne znaczenie odgrywa wzrost dostępności Internetu oraz usług świadczonych drogą elektroniczną, które w naturalny sposób są przystosowane do wykorzystywania baz danych.

W 2001 roku META Group (obecnie Gartner) opublikowała raport[2], który opisuje big data w modelu 3V:

  • duża ilość danych (ang. volume),
  • duża zmienność danych (ang. velocity) oraz
  • duża różnorodność danych (ang. variety).

Model ten uzupełniony został o kolejną składową - o ocenę (weryfikację), (ang. value) posiadanych danych - dochodząc do modelu 4V.

Zastosowanie modelu 4V w polskiej wersji 4W przedstawia się następująco:

  • wykorzystanie - wykorzystaj najpierw wewnętrzne (własne) zasoby danych,
  • wnioskowanie - umiejętnie stosuj techniki analityczne, użyj ekspertów,
  • wzbogacanie - wzbogacaj własne dane o informacje z rynku, używaj słowników i baz referencyjnych,
  • weryfikacja - koniecznie weryfikuj hipotezy i wnioski.[3]

W 2012 roku Gartner uzupełnił podaną wcześniej definicję wskazując, iż „big data to zbiory informacji o dużej objętości, dużej zmienności i/lub dużej różnorodności, które wymagają nowych form przetwarzania w celu wspomagania podejmowania decyzji, odkrywania nowych zjawisk oraz optymalizacji procesów”[4].

Zobacz też[edytuj | edytuj kod]

Przypisy[edytuj | edytuj kod]

  1. Tom White: Hadoop: The Definitive Guide. O’Reilly Media, 10 maja 2012, s. 3. ISBN 978-1-4493-3877-0. (ang.)
  2. Laney Douglas: 3D Data Management: Controlling Data Volume, Velocity and Variety (ang.). Gartner. [dostęp 6 lutego 2001].
  3. Alternatywna teoria 4W - www.ekonomia.rp.pl (Dostęp: 13.03.2014)
  4. Laney Douglas: The Importance of 'Big Data’: A Definition (ang.). Gartner. [dostęp 21 czerwca 2012].