Wprowadzenie
W tym rozdziale wyjaśnimy najważniejsze pojęcia związane z eksploracją danych. Wymienimy i scharakteryzujemy algorytmy eksploracji danych. Przedstawimy także kluczowe różnice pomiędzy analizą eksploracyjną a przetwarzaniem danych w oparciu o model OLAP.Wstęp
Definicje pojęć
Algorytmy
Główne zadania
Data mining a OLAP
Business Intelligence
Warto zobaczyć:
programy do pobrania bitcomet najlepszy hosting allplayer download
Eksploracja danych - definicja pojęć
Eksploracja danych (ang. data mining) jest procesem polegającym na odkrywaniu
niejawnych, wcześniej nieznanych i potencjalnie użytecznych informacji, zależności
i związków w zbiorze danych. Wykorzystanie do analizy danych zaawansowanych metod
i algorytmów, które zostaną opisane i wykorzystane w dalszej części pracy, daje możliwość
zbadania charakteru zgromadzonych danych oraz pozwala na wyciągnięcie z nich
konkretnych informacji i wiedzy. Bardzo często pojęcia eksploracji danych i odkrywania
wiedzy a dokładniej odkrywania wiedzy w bazach danych (ang. knowledge discovery in
databases) przeplatają się ze sobą a często używane są wymiennie w zależności od podejścia.
W podejściu teoretycznym rozróżnia się te określenia, gdyż odkrywanie wiedzy odnosi się
całościowo do procesu odkrywania przydatnych i pożytecznych informacji i wiedzy poprzez
eksplorowanie baz danych, podczas gdy eksploracja danych ma węższe znaczenie, gdyż
dotyczy samego wyboru i wykorzystania algorytmów oraz aplikacji służących do wydobycia
z baz reguł, zależności, schematów. Narzędzia eksploracji danych są wykorzystywane do
automatyzacji procesu poszukiwania związków, zależności, relacji czy schematów i generują
rezultaty, które mogą zostać użyte zarówno bezpośrednio w procesie podejmowania decyzji
przez określone osoby jak również zaawansowane systemy wspomagania decyzji.
Proces eksploracji danych można podzielić na następujące etapy:
- Analiza problemu
- Określenie celów procesu
- Wybór danych i rozpoczęcie procesu gromadzenia
- Oczyszczenie danych i wstępne przetwarzanie
- Przygotowanie danych, redukcja i transformacja, wybór istotnych atrybutów, redukcja wymiarów i liczby zmiennych
- Wybór funkcji eksploracji, wybór algorytmów (metod)
- Eksploracja danych
- Weryfikacja i walidacja wykrytych zależności
- Prezentacja odkrytej wiedzy (wizualizacja uzyskanych wyników)
- Wykorzystanie odkrytej wiedzy