Datová analytika je směr, který mě v poslední době velmi zaujal a myslím si, že o této oblasti se na české scéně ještě příliš moc nehovoří.
Je to vcelku mladý obor, který vznikl v důsledku nárůstu množství dat, které dnes svět generuje a různé organizace uchovávají. Do datové analytiky spadá jak třeba analýza segmentu trhu, retence uživatelů, tak také i hledání vzorů v chování lidí zaznamenaném v nějaké datové struktuře nebo třeba hledání vzorů mezi nádorovými onemocněními. Prakticky ale vše, co se týká dat.
Datový analytik často pracuje s big data, i když já to slovo příliš moc nemám rád – je to takový buzzword. Četl jsem různé definice tohoto povolání a ve všech se opakují často tyto požadavky na znalosti a schopnosti:
- statistika – datový analytik by měl mít alespoň základní znalost statistiky
- strojové učení – při hledání vzorů v datech apod. se často uplatňují metody strojového učení jako shluková analýza, hledání vzdálených bodů apod.
- programování – jelikož se často pracuje s daty, které je nutné předzpracovat, upravovat apod., je potřeba umět psát skripty, které nám s tím pomohou. Poslední dobou je také čím dál populárnější jazyk R, který je pro datového analytika jako dělaný. Ale o tom někdy příště.
- vizualizace – data je třeba často vizualizovat, takže je nutné mít znalosti, kdy se hodí tento typ a kdy zase třeba tento typ vizualizace
- prezentace, interpretace informací – výsledky je často nutné prezentovat a interpretovat lidem, kteří na základě výstupu provádějí následná rozhodnutí, optimalizují své procesy apod.
Do práce datového analytika z mého pohledu také spadá správa informací a celé datové infrastruktury (logy, vědět, kde získat, která data, navrhovat a případně implementovat nástroje, které poskytují výstupy automaticky v podobě dashboardů atd.
Na závěr si dovolím ukázat jednu zajímavou infografiku zabývající se tímto oborem:
Zdroj: http://venturebeat.com/…ists-needed/