SAP HANA

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj
SAP HANA
SZBD
SAP 2011 logo.svg
Logo programu
Producent SAP AG
Napisane w C, C++
Pierwsze wydanie 2010-11-2020 listopada 2010
Aktualna wersja stabilna SAP HANA 1.0 SP8
2014-05-2828 maja 2014
Licencja Zamknięte oprogramowanie
www.saphana.com

SAP HANAimplementacja przetwarzania danych w pamięci RAM firmy SAP AG. Składa się z czterech komponentów:

  • SAP HANA DB (lub HANA DB) – bazy danych w pamięci (ang. in-memory database),
  • SAP HANA Studio – zestawu narzędzi oferowanych przez SAP do obsługi i modelowania danych,
  • SAP HANA Appliance – certyfikowanych przez firmę SAP serwerów, przeznaczonych do instalacji i obsługi HANA DB oraz zestawu narzędzi do transformacji i replikacji pomocnych podczas przenoszenia danych z innych systemów i baz danych do bazy danych HANA,
  • SAP HANA Application Cloud – infrastruktury opartej na przetwarzaniu w chmurze.

Technologia SAP In-Memory Appliance wykorzystuje duże ilości pamięci operacyjnej RAM (128 GiB, 256 GiB, 512 GiB, 1 TiB lub więcej w zależności od pożądanej mocy obliczeniowej serwera), wielordzeniowe procesory umożliwiające równoległe przetwarzanie danych oraz szybkie dyski Solid State Drive zamiast tradycyjnych dysków twardych w celu zapewnienia lepszej wydajności dla aplikacji transakcyjnych i analitycznych[1]. Dzięki zastosowaniu takich komponentów silnik in-memory może prezentować dane transakcyjne lub z hurtowni danych w czasie zbliżonym do rzeczywistego. Platforma SAP HANA pozwala na wykonywanie w czasie rzeczywistym operacji na danych i analiz o dowolnej szczegółowości, stopniu agregacji i liczbie wymiarów. Wyraźnych wzrostów wydajności można spodziewać się w przetwarzaniu dużych wolumenów danych[2].

Podczas, gdy wcześniej HANA była różnie nazywana jako HAsso's New Architecture[3] (w odniesieniu do współzałożyciela firmy SAP – Hasso Plattnera) lub High Performance ANalytic Appliance, obecnie HANA jest nazwą a nie akronimem[4][5].

SAP HANA DB[edytuj | edytuj kod]

Wydajność[edytuj | edytuj kod]

Baza danych HANA DB jest głównym komponentem rozwiązania SAP HANA. W odróżnieniu od klasycznych, relacyjnych baz danych HANA DB w całości rezyduje w pamięci operacyjnej serwera, a system dyskowy wykorzystuje jedynie do zapisu stanu pamięci lub wykonywania kopii bezpieczeństwa[1]. Dzięki temu, że wszystkie dane znajdują się w pamięci operacyjnej eliminuje się konieczność ładowania danych z plików znajdujących się w systemie dyskowym. Taka architektura znacznie przyspiesza procesy zapytań i analizy danych w bazie danych zlokalizowanej w całości w pamięci, ponieważ dyskowe operacje wejścia/wyjścia (ang. I/O) są często "wąskim gardłem" przepustowości całego systemu. Jest w 100% zgoda z ACID.

Zastosowane rozwiązania optymalizacyjne w zakresie przechowywania i zarządzania informacją w HANA DB[1]:

  • Zapis kolumnowy danych jako podstawowy sposób przechowywania informacji (obok typowego zapisu wierszowego).
  • Kompresja danych.
  • Partycjonowanie tablic.
  • Wykorzystanie delty do operacji wstawiania nowych danych.

Przechowywanie danych w kolumnach tablicy zamiast tradycyjnego przechowywania w wierszach pozwala na gromadzenie danych tego samego typu w jednej kolumnie. Dzięki temu możliwe jest zastosowanie skutecznych i wydajnych mechanizmów kompresji danych pozwalających na zmniejszenie zapotrzebowania na pamięć oraz szybszych czasów dostępów do danych. Według SAP przetwarzanie w oparciu o pamięć operacyjną jest nawet do 1000 razy szybsze niż w przypadku tradycyjnych operacji na dysku[6].

Dodatkowa funkcjonalność[edytuj | edytuj kod]

Oprócz zapewnienia wydajności rozwiązanie SAP HANA zawiera wbudowane elementy dodatkowe[7]:

  • Silnik przetwarzania grafów (szukanie najlepszej ścieżki).
  • Silnik tekstowy (wyszukiwanie w danych nieustrukturalizowanych).
  • Biblioteka funkcji biznesowych (do wykorzystania przez zewnętrzne aplikacje).
  • Biblioteka funkcji predykcji[8] (np. clustering, analiza ABC, algorytm C4.5, regresja liniowa).
  • Wbudowany język R do obliczeń statystycznych[9].

Wydania[edytuj | edytuj kod]

SAP HANA powstały na bazie Sybase IQ – serwera analitycznego firmy Sybase, która została przejęta przez SAP w maju 2010 r.[10]

Wersje:

  • SP0 – wydana 2010-11-2020 listopada 2010 r. pierwsza, publiczna wersja HANA.
  • SP1 – wydana 2011-06-2020 czerwca 2011 r.
  • SP2 – wydana 2011-06-2727 czerwca 2011 r.
  • SP3 – wydana 2011-11-077 listopada 2011 r.
  • SP4 – wydana 2012-05-044 maja 2012 r.
  • SP5 – wydana 2012-12-2121 grudnia 2012 r.[11]
  • SP6 – wydana 2013-07-033 lipca 2013 r.[12]
  • SP7 – wydana 2013-07-033 lipca 2013 r.[13]
  • SP8 – wydana 2014-05-2828 maja 2014 r.[14]

Przykłady wdrożeń[edytuj | edytuj kod]

  • Grupa CEDC – pierwszy klient w Polsce, który zdecydował się na zakup i wdrożenie SAP HANA w celu utworzenia platformy hurtowni danych - za wdrożenie odpowiedzialna była firma SID Group[15].
  • National Basketball Association (NBA) – wybrało platformę SAP HANA, aby stworzyć na jej podstawie rozbudowany serwis statystyczny dla kibiców w portalu stats.nba.com. Praktycznie nieograniczone ilości informacji i dane od 1946 r. udostępniane będą w czasie rzeczywistym dla kibiców[16][17]
  • Uniwersytet Harvarda – wykorzystuje SAP HANA w połączeniu z językiem R, text mining i zapytań SQL opartych na logice rozmytej[18].
  • Nomura Research Institute (NRI) – dostawca usług IT dla sektora transportowego przeszukuje z pomocą SAP HANA 336 milionów rekordów z 13 tys. taksówek na temat ruchu ulicznego w Tokio w czasie niewiele dłuższym niż jedna sekunda. Szybka interpretacja tak ogromnych danych pozwala firmom taksówkowym kierować swoje pojazdy efektywniej i w czasie rzeczywistym[19]
  • PKP Polskie Linie Kolejowe S. A. - system bazodanowy dla hurtowni SAP Business Warehouse oraz dla silnika dla analityki biznesowej (platforma raportowa BI/BW z wielokrotnie skróconym procesem raportowania)

Społeczność programistów[edytuj | edytuj kod]

Społeczność programistów wykorzystujących SAP HANA to SAP HANA Developers Center, oferujący dostęp do materiałów, forum oraz serwerów SAP HANA z bezpłatną licencją deweloperską hostowane w publicznej chmurze (do wyboru m.in. AWS, CloudShare, Microsoft Azure itd.).

Rozwiązania konkurencyjne[edytuj | edytuj kod]

  • Rozwiązania sprzętowe:
  • Systemy zarządzania bazą danych w pamięci (ang. In-memory database management systems):

Przypisy

Linki zewnętrzne[edytuj | edytuj kod]