Cross Industry Standard Process for Data Mining

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania

Cross Industry Standard Process for Data Mining (CRISP-DM) – schemat pokazujący ogólny proces eksploracji danych[1].

Fazy[edytuj | edytuj kod]

CRISP-DM

Zgodnie ze standardem proces zgłębiania danych podzielony jest na 6 faz[2]:

1 Zrozumienie uwarunkowań biznesowych

Jest to pierwszy i zarazem kluczowy etap metodologii. Najważniejszym jest tu jasne sformułowanie celów i wymagań projektu.

2 Zrozumienie danych

Etap ten składa się z dwóch podetapów:

  • zebranie danych,
  • ocena przydatności danych.

3 Przygotowanie danych

Na przygotowanie danych składają się kolejno:

  • wykonanie przekształceń,
  • czyszczenie danych,
  • usuniecie wartości skrajnych.

4 Modelowanie

Kluczowe w tej fazie są:

  • wybór i zastosowanie odpowiedniej techniki modelującej,
  • skalowanie parametrów modelu.

5 Ewaluacja

W ramach ewaluacji wykonywana jest:

  • ocena modeli pod względem jakości i efektywności,
  • ustalenie czy model spełnia wszystkie wymagania.

6 Wdrożenie

Ostatni etap, którego celem jest wykorzystanie stworzonego modelu.

Przypisy

  1. Shearer C.: The CRISP-DM model: the new blueprint for data mining, J Data Warehousing (2000); 5:13–22.
  2. Michał Siemaszkiewicz(2012); CRISP-DM.

Linki zewnętrzne[edytuj | edytuj kod]