RapidMiner – jeden z nástrojov na analýzu dát

logo RapidMinerObjavovanie znalostí z databáz je multidisiplinárna oblasť a mať čo i len prehľad o všetkých možnostiach a metódach ako sa k potrebným znalostiam dostať by naozaj zabralo veľa času so získavaním informácií a skúseností. Preto sme sa rozhodli aspoň nejaké možností prípravy dát a získavania znalostí ukázať na niektorých názorných príkladoch.
V dnešnej pretechnizovanej dobe, kde zbierame kvanta dát z rôznych systémov a v rôznych formátoch, nie je jednoduché tieto dáta spracúvať a analyzovať. Prácu s dátami nám uľahčujú mnohé aplikácie, pomocou ktorých vieme dáta spracovať, analyzovať, zobrazovať a reportovať, čo by bez špeciálnych aplikácií a výpočtovej techniky bolo nemožné alebo prinajmenšom časovo veľmi zdĺhavé. Skôr než prejdeme k názorným príkladom, pokúsime sa predstaviť niektoré aplikácie, ktoré by nám mohli pomôcť pri získavaní znalostí z databáz.
Prvým zo zaujímavých nástrojov využiteľných pri analyzovaní dát a získavaní znalostí je RapideMiner. Tento širokej verejnosti málo známi nástroj má naozaj široké využitie pri spracovaní dát, prijateľné užívateľské rozhranie a hlavne je zadarmo.
Túto aplikáciu ako aj potrebnú dokumentáciu k nej si môžete stiahnuť na stránke: RapidMiner. Aplikácia je dostupná pre platformy Windows, Mac, Linux, Unix.
Po nainštalovaní a spustení aplikácie sa zobrazí nasledujúce prehľadné okno so základnými možnosťami.

RapidMiner základné okno po spustení

RapidMiner základné okno po spustení


Analytický proces
Spracovanie dát a získavanie znalostí pomocou RapidMiner-a je založený na vytvorení procesu s využitím operátotov (modulov). Pri každom module nastavíme potrebné vlastností a parametre. Jednotlivé operátory sú poprepájané pomocou väzieb a tým sa vytvára kompletný proces spracovania dát.
Pokiaľ Vám nepostačujú základné operátori, je možné ich rozšíriť updatom a tým aj doplnenie ďalších operátorov z ďalších aplikácií ako je Weka, štatistický nástroj R a podobne.
RapidMiner okno pre návrh procesu

RapidMiner okno pre návrh procesu


V závislosti od riešeného problému a použitých metód, je možné spracované dáta zobraziť vo viacerých formátoch (dáta, grafy, textový popis…)
RapidMiner - ukážka zobrazenia výsledkov

RapidMiner - ukážka zobrazenia výsledkov

Podrobné informácie o používaní tohto nástroja ako aj o jeho možnostiach nájdete v podrobnej dokumentácií dostupnej na stránke projektu dokumenácia RapidMiner.
Je vidieť, že okrem drahých a komerčne propagovaných nástrojov na analýzu dát ako sú napríklad (SPSS, SAS alebo Oracle Data mining), existujú aj účinné nástroje, ktoré sú zadarmo a ktoré vieme využiť pri získavanie znalostí aj z objemných zdrojov dát.

Tento obsah bol zaradený v Dáta. Zálohujte si trvalý odkaz.

Komentáre sú uzavreté.