Algorytmy



Wstęp

Odkrywanie asocjacji

Asocjacje w IBM Digger

Klasteryzacja


Warto zobaczyć:
gimp centrala voip reklama w internecie Skuteczne linki sponsorowane w Google

Klasteryzacja

Klasteryzacja przy użyciu funkcji demograficznych

Podstawową techniką wykorzystywaną w procesie klasteryzacji jest zastosowanie funkcji demograficznej. Funkcja dokonuje podziału dużych zbiorów danych na klastry. Podobieństwa pomiędzy poszczególnymi rekordami w zbiorze danych są określane poprzez porównywanie wartości pól. Na podstawie podobieństwa rekordy przydzielane są do odpowiednich klastrów. Rekordy cechujące się wysokim stopniem podobieństwa są kwalifikowane do tego samego klastra.

Klasteryzacja w pakiecie IBM Intelligent Miner For Data

Aby w pakiecie IM4D zdefiniować nową funkcję klastryzacji wykonujemy czynności analogiczne jak w przypadku tworzenia funkcji asocjacji opisanej w punkcie 6.1.2. Poniżej wyodrębnimy zasadnicze różnice w konfiguracji obu funkcji. Tworzymy nową funkcję eksploracji poprzez wybranie przycisku Create mining a następnie spośród dostępnych funkcji wybieramy Clustering – Demographic. Podajemy nazwę ustawień „Settings name”, komentarz - „Comment” oraz możemy zaznaczyć opcję „Show the advanced pages and controls” jak na poniższym rysunku.
Klasteryzacja - Konfiguracja

Krok wyboru źródła danych wejściowych jest analogiczny do opisanego w punkcie 6.1.2. Kolejnym krokiem jest parametryzacja funkcji klasteryzacji. Dokonujemy wyboru pomiędzy „Clustering mode” a „Application mode” oraz definiujemy wartości parametrów:
Klasteryzacja - Parametryzacja

Następnym krokiem jest wybór pól, które będą brały udział w procesie klasteryzacji. Wyboru dokonujemy pomiędzy polami:
· Active fields – pola aktywne, pola brane pod uwagę w procesie klasteryzacji,
· Supplementary fields – pola dodatkowe, wykorzystywane w wyniku do celów statystycznych.

 budowa stron www strony internetowe warszawa nero odzyskiwanie danych