Crowdsourcing – efektívny prístup k spracovaniu dát

Be smarted!

Crowdsourcing – efektívny prístup k spracovaniu dát

27. novembra 2014 Dáta Extrakcia informácii 0

crowd_1
Článok popisuje význam dát a ich získavanie pre potrebu konkurenčnej výhody spoločnosti. Jedna z metód, ako získať kvalitné dáta, je crowdsourcing, respektíve jedna z jeho podoblastí – distribuovanie mikro úloh formou verejnej výzvy pre širokú verejnosť alebo pre špecifikovanú skupinu riešiteľov na základe ich skúsenosti a znalosti potrebných pri riešení konkrétnych úloh. Príspevok síce poukazuje na význam dát pre potreby marketingu, ale rovnaký princíp je možné využívať aj v iných oblastiach biznisu a výskumu, kde sa pracuje s dátami.

Marketing vždy bol a bude závislý na dátach. Ich kvalita a spôsob použitia Vám môže priniesť konkurenčnú výhodu oproti ostatným subjektom, ktoré s Vami bojujú o zákazníka. Na druhej strane ak im nevenujete dostatočnú pozornosť, môžete stratiť pozíciu na trhu. Pod dátami v tomto prípade rozumieme informácie o zákazníkoch, prehľad ich nákupov, realizovaný prieskum trhu, názory na Vašu spoločnosť z diskusií, zo sociálnych sieti atď. Niektoré dáta sú už na začiatku štrukturované a pripravené na ďalšie spracovanie pomocou štatistických metód a analýz, na základe ktorých môžeme vyvodzovať závery a efektívne riadiť spoločnosť. Iné ostávajú nevyužité hlavne preto, že ich množstvo je veľké na to, aby ich spracoval človek a pre strojové spracovanie nie sú pripravené. To môže spôsobiť stratu dôležitých informácií, ktoré by mohli byť hnacím motorom ďalšieho smerovania firmy.

Spracovanie veľkého množstvá dát sa stáva v mnohých prípadoch časovo a finančne neúnosne, čo si vyžaduje zabezpečenie dodatočných ľudských zdrojov. Na to nadväzuje ďalšia agenda, vyhradenie pracoviska pre nových zamestnancov, nakúpenie techniky a iné technicko-administratívne zastrešenie danej úlohy.

Novodobým trendom v tejto oblasti je rozdelenie zložitej úlohy na množinu elementárnych mikro úloh rovnakého typu, ktoré sa pomocou internetu rozdistribuujú ľuďom, ochotným za finančnú odmenu resp. iným spôsobom motivácie tieto úlohy riešiť. Tieto mikro úlohy môžu byť natoľko jednoduché, že je ich schopná riešiť aj laická verejnosť bez hlbšieho prehľadu pozadia problému. Tento spôsob riešenia úloh sa nazýva crowdsourcing (Crowdsourcing je pojem, ktorý sa používa na označenie procesu získavania požadovaných služieb, kreatívnych nápadov alebo obsahu od prispievateľov z veľkej skupiny ľudí, prevažne z online komunity, namiesto tradičných zamestnancov.). Tento termín vymyslel Jeff Howe v roku 2006. No už v roku 2003 Luis von Ahn a jeho kolegovia uviedli koncept „ľudskej výpočtovej sily“, ktorá využíva schopnosť človeka vykonávať výpočtové úlohy, ktoré počítače nevedia riešiť. Crowdsourcingom sa označujú aj ďalšie úlohy, ktoré sú riešené širokou verejnosťou: crowdfunding (získavanie prostriedkov na financovanie vlastných projektov), kreatívny crowdsourcing (požiadavka na vytvorenia grafického dizajnu, vytvorenie loga, napísanie textu) a.i. My sa však v tomto príspevku venujeme riešeniu mikro úloh, ako sú anotácie dokumentov metadátami, vyhľadávanie informácii na webe, či extrakcia dát z dokumentov.

Pri návrhu crowdsourcingového systému sme postavený pred viacero otázok, ktoré musíme vyriešiť, aby zadané úlohy boli vyriešené v postačujúcej kvalite:

Motivácia

    – Aký spôsob motivácie budeme používať pri participovaní na riešení úloh? Riešitelia môžu byť motivovaní vnútornou motiváciou, ako je sociálny kontakt a trávenie ich voľného času, alebo vonkajšou motiváciou, čo je zvyčajne finančná odmena.

Kvalita

    – Ako dosiahneme a vyhodnotíme požadovanú kvalitu riešených úloh? (viacúrovňové vyhodnocovanie, štatistické filtrovanie, systém reputácii, a.i.)

Demografia

    – Kto je cieľová skupina? (ľudia špecifickej vekovej skupiny, určitého bydliska, pracovnej pozície, či sociálneho statusu)

V tomto článku sme načrtli jednu z metód, ktorú je možné aplikovať pri spracovaní dát a to je crowdsourcing – distribúcia mikro úloh. V nasledujúcom príspevku ukážeme pár príkladov z praxe, kde sa tento spôsob využíva.