Przetwarzanie danych
Na tym etapie przygotowujemy wcześniej wybrane i zgromadzone dane do właściwej
analizy i eksploracji. Proces przetwarzania rozpoczyna ekstrakcja danych, czyli
wyodrębnienie tylko interesujących analityka faktów z całego zbioru. Duże zbiory danych
zawierają bardzo dużą ilość rekordów i atrybutów spośród których należy wybrać te, które
utworzą optymalne źródło danych dla postawionego problemu analizy i eksploracji.
Analizując problem ekstrakcji danych ze zbioru staramy się odpowiedzieć sobie na pytania:
- Jakie połączenie cech może przynieść nam najwięcej informacji?
- Które, z zawartych w zbiorze danych, atrybuty mają największe znaczenie dla
analizowanego problemu?
- Które pola możemy pominąć usunąć, gdyż nie niosą żadnej przydatnej wiedzy w
rozpatrywanym przypadku?
Dzięki odpowiedziom na powyższe pytania budujemy optymalne źródło danych,
optymalne pod względem ilości danych i ich wartości merytorycznej.
Następnym etapem jest oczyszczenie danych, czyli eliminacji rekordów błędnych lub
niepełnych. Aby wynik analiz i eksploracji był obarczony jak najmniejszym błędem należy
wynikowe źródło danych poddać procesowi walidacji. Proces ten polega na odnalezieniu a
następnie usunięciu lub poprawieniu danych, które są niepełne (niekompletne), niepoprawne
(np. data wykraczająca poza zakres) lub błędne.
Kolejnymi etapami są integracja, czyli ujednolicenie danych pochodzących z różnych
źródeł oraz transformacja danych do wymaganych formatów.
Eksploracja
Odpowiednio przygotowane dane poddawane są właściwej eksploracji
z wykorzystaniem jednego z możliwych algorytmów wymienionych wcześniej w pracy
w punkcie 3.1.2. Otrzymane wyniki poddawane są procesowi wizualizacji, czyli graficznej
prezentacji i przedstawieniu odkrytych zależności i związków w danych.
Interpretacja wyników
Etap interpretacji uzyskanych wyników przeprowadzonych analiz ma na celu
przekształcenie uzyskanych informacji w wiedzę. Cały proces może zostać wykonywany
w sposób iteracyjny. Na etapie interpretacji poprzednich wyników określamy zmiany jakie
należy wprowadzić we wcześniejszych etapach procesu eksploracji tak, by uzyskać lepsze
rezultaty, które mogą się przyczynić do wzbogacenia gromadzonej i odkrywanej wiedzy.
tłumaczenia opole strony internetowe Poznań samsung galaxy s5660 domeny