Proces eksploracji danych

W tym rozdziale zajmiemy się uszczegółowieniem procesu eksploracji danych z uwzględnieniem podziału na poszczególne etapy i ich charakterystykę.

Wstęp

Wybór źródła danych

Przetwarzanie, eksploracja, interpretacja danych

Przykład procesu eksploracji


Warto zobaczyć:
bestplayer ares download skype domeny

Przetwarzanie danych

Na tym etapie przygotowujemy wcześniej wybrane i zgromadzone dane do właściwej analizy i eksploracji. Proces przetwarzania rozpoczyna ekstrakcja danych, czyli wyodrębnienie tylko interesujących analityka faktów z całego zbioru. Duże zbiory danych zawierają bardzo dużą ilość rekordów i atrybutów spośród których należy wybrać te, które utworzą optymalne źródło danych dla postawionego problemu analizy i eksploracji. Analizując problem ekstrakcji danych ze zbioru staramy się odpowiedzieć sobie na pytania: Dzięki odpowiedziom na powyższe pytania budujemy optymalne źródło danych, optymalne pod względem ilości danych i ich wartości merytorycznej. Następnym etapem jest oczyszczenie danych, czyli eliminacji rekordów błędnych lub niepełnych. Aby wynik analiz i eksploracji był obarczony jak najmniejszym błędem należy wynikowe źródło danych poddać procesowi walidacji. Proces ten polega na odnalezieniu a następnie usunięciu lub poprawieniu danych, które są niepełne (niekompletne), niepoprawne (np. data wykraczająca poza zakres) lub błędne. Kolejnymi etapami są integracja, czyli ujednolicenie danych pochodzących z różnych źródeł oraz transformacja danych do wymaganych formatów.

Eksploracja

Odpowiednio przygotowane dane poddawane są właściwej eksploracji z wykorzystaniem jednego z możliwych algorytmów wymienionych wcześniej w pracy w punkcie 3.1.2. Otrzymane wyniki poddawane są procesowi wizualizacji, czyli graficznej prezentacji i przedstawieniu odkrytych zależności i związków w danych.

Interpretacja wyników

Etap interpretacji uzyskanych wyników przeprowadzonych analiz ma na celu przekształcenie uzyskanych informacji w wiedzę. Cały proces może zostać wykonywany w sposób iteracyjny. Na etapie interpretacji poprzednich wyników określamy zmiany jakie należy wprowadzić we wcześniejszych etapach procesu eksploracji tak, by uzyskać lepsze rezultaty, które mogą się przyczynić do wzbogacenia gromadzonej i odkrywanej wiedzy.  tłumaczenia opole strony internetowe Poznań samsung galaxy s5660 domeny