Data scientist

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Data scientist – termin określający zawód osoby zajmującej się analizą danych nieuporządkowanych, w szczególności big data.

Został spopularyzowany przez Harvard Business Review w roku 2012. Jako polski odpowiednik niekiedy stosuje się określenie „mistrz danych”.

Krytycy wskazują na jego bliskie pokrewieństwo do innego od dawna istniejącego zawodu, jakim jest analityk danych. Jako kontrargumentację wskazuje się, że Data Scientist musi:

  • wykazać wszechstronne umiejętności poruszania się w niespójnych, różnorodnych zbiorach danych, związane z technologiami, które obecnie bardzo dynamicznie ewoluują
  • odnosi się do jego cech osobowości: jest zaangażowany w zrozumienie biznesu - potrafi dostrzec szeroki kontekst swoich analiz, wyjść poza schematyczne rozwiązania, przenieść rozwiązanie z innej gałęzi biznesowej, myśli innowacyjnie i strategicznie, jest ciekawy świata i patrzy na niego przez pryzmat danych z różnorodnych źródeł, rozwiązuje problemy, ma zacięcie hackerskie
  • odnosi się do jego miękkich umiejętności: zdolność do komunikacji - także z wyższą kadrą zarządzającą, zdolność do komunikacji poprzez wysokiej jakości wizualizacje, umiejętność wyjaśnienia wykonanych złożonych analiz
  • często posiada kompetencje analityka i / lub administratora baz danych służących do przetwarzania dużych zbiorów danych (ang. Big Data) - porusza się w środowiskach takich jak Hadoop czy Spark.

Natomiast praca tradycyjnego analityka danych ogranicza się do stosowania metod analizy statystycznej do danych pochodzących z hurtowni, charakteryzujących się spójną strukturą, a zatem stosunkowo łatwych do obróbki. Wyciąga podstawowe wnioski.

Bibliografia[edytuj]