Datová gramotnost: nutnost i konkurenční výhoda

Lubomír Husar

 

Data ovlivňují to, jak vnímáme svět, ale i jak svět vnímá nás. Mají vliv na boj s pandemií, na volební preference politických stran nebo třeba na to, do čeho lidé investují svoje peníze. Proto jsou i ústředním tématem rozhovoru s Lubomírem Husarem, zakladatelem společnosti LovelyData.

Kde se pojem datová gramotnost vzal? Jde v českém prostředí o dobře známý pojem?

Domnívám se, že v českém prostředí je to stále poměrně nový pojem. Já osobně jsem se s ním (Data Literacy) poprvé seznámil v zahraničí. Ve společnostech, kde jsem působil, to bylo mezi manažery docela diskutované téma. Potýkali se totiž s nedostatkem lidí, kteří byli schopni pracovat s daty na takové úrovni, jakou jejich náročné projekty vyžadovaly. Díky tomu byli nuceni najímat externisty. Tak jsem se na tyto projekty dostal i já.

Proč jsou data v životě lidí, a to nejen ve firemní praxi, ale i v běžném životě, tolik důležitá?

Pokud nemáte k dispozici data, tak se řídíte jen svou intuicí. To nemusí být vždy špatně, ale často jde o rozhodování na základě pocitů, je to tedy hodně subjektivní. Data nám pomáhají rozhodovat se objektivně. Samozřejmě za předpokladu, že se objektivně rozhodovat chceme. Navíc datová gramotnost je dnes nutná dovednost, bez které se v mnoha oborech už neuplatníte. Rozumíte skutečně všem datům, na která například na internetu narazíte? Dokážete si z nich sami udělat závěry, nebo se musíte spoléhat na interpretaci někoho jiného? A nebylo by lepší si je umět uspořádat sami tak, jak je to pro vás nejlepší, nejpřehlednější, nejrelevantnější? Pracovat s daty je zkrátka schopnost, která se teď hodí víc než kdy jindy. A v budoucnu tomu nebude jinak.

Umí si lidstvo vůbec poradit s množstvím virtuálních dat a informací, které každý v online prostředí generuje?

Snažíme se a učíme se. Takový objem dat samozřejmě nezvládá na sto procent zpracovat nikdo. Ani jednotlivci, ani firmy, ani vlády jednotlivých zemí. Není to prostě v lidských silách. Proto je důležité si určit priority a rozhodnout se, co chceme sledovat, a k tomu pak data využít. Naštěstí nám dnes s rozhodováním pomáhají počítače. Jednou takovou oblastí je i dnes tolik diskutované strojové učení.

Je vůbec reálné všechna sesbíraná data dále využít? Nebo si data ukládáme jen proto, že můžeme?

Dostali jsme se do stavu, kdy sbíráme ohromné množství dat, protože můžeme. Ukládání dat během posledních let neskutečně zlevnilo. Nikdo dnes už nemusí přemýšlet, jestli je nějaká informace důležitá, nebo není. Prostě se dnes uloží a později se uvidí, jestli se dá nějak využít. To ale samozřejmě není případ jen posledních několika let. Všichni, kdo ukládají data, dlouhodobě bojují s tím, jak z nich dostat nějaké smysluplné informace. Zároveň můžete mít hodně dat, ale mimořádná situace všechno změní. Dobrým příkladem jsou například aerolinky. Ty mají o cestujících spoustu informací, ale dnes je pro ně složité cokoliv předpovídat, protože nikdo neví, jak bude vypadat cestování za pár měsíců nebo za rok.

V současnosti existuje interdisciplinární obor tzv. datová věda (data science). Jak se aplikuje v praxi?

Ano, datová věda je opravdu průnik více disciplín. Datový vědec by ideálně měl mít znalosti z několika oborů – např. matematiky, statistiky, informačních technologií a měl by také rozumět businessu. Protože takových jedinců není mnoho, tak je tato role běžně rozdělená mezi více lidí – specialistů na danou oblast. Jeden člověk pak má na starosti získávání a čištění dat, další se zabývá strojovým učením apod. Firmy samozřejmě datovou vědu využívají, protože pokud chtějí být úspěšné, tak se bez „data driven“ přístupu neobejdou. Data dnes rozhodují vlastně o všem – od náboru zaměstnanců přes optimalizaci výroby až po marketing nebo prodej. Jednotlivci data určitě využívají také. Krásným příkladem je například nákup nového bytu. Bez analýzy dat (cena, lokalita, stáří stavby, občanská vybavenost apod.), se taková akce rovná hazardu.

Platí už nyní, že datová gramotnost je konkurenční výhoda? Ať pro jednotlivce například na trhu práce, či pro firmy a jejich konkurenceschopnost?

Jsem o tom pevně přesvědčen. Vždyť „data-driven“ kultura by dnes měla být samozřejmostí v každé firmě. Do takového ideálního stavu nám ale ještě kus cesty zbývá. Realita je taková, že firem a institucí, které jsou řízeny daty, je stále menšina. Nedávno jsem četl článek, který konstatoval, že jen čtvrtina firem je skutečně řízená daty. Je to zároveň obrovská příležitost pro jednotlivce, protože poptávka po lidech, kteří dokážou pracovat s daty, stále roste. Stačí se podívat na dnešní nabídky práce. Výrazy jako data, čísla, tabulky nebo databáze, najdete i u pozic, kde to dřív rozhodně nebývalo zvykem.

Je práce s velkými a různorodými daty jen pro programátory?

Už dávno není. S rozvojem hardwaru a jeho zlevňováním se rozšířila i nabídka softwaru. Dnes můžete na svém laptopu bez problémů analyzovat desítky miliónů řádků dat. Na to jste ještě před deseti lety potřebovali výkonný server. Plus tým lidí, kteří to měli na starosti. Navíc tato demokratizace zapříčinila obrovskou poptávku firem po lidech, kteří dokážou s daty pracovat. Bohužel, takových lidí je stále nedostatek. A to i celosvětově. Zároveň je to velká příležitost pro všechny, kteří do tohoto oboru chtějí proniknout. Dnes totiž není výjimkou, že si datové dovednosti osvojují i dospělí, kteří jsou ze školy už nějaký ten
pátek pryč.

Když mluvíte o škole, myslíte, že by datová gramotnost měla být jednou ze základních dovedností, které si osvojujeme už třeba v rámci základního vzdělání?

Myslím, že ano. Datová gramotnost by měla být nedílnou součástí informatiky, která se učí už na základních školách. Vždyť schopnost uspořádat si data a získat z nich užitečné informace se nám bude hodit po celý život.

Pracoval jste ve velkých společnostech v IT. Proč jste se rozhodl založit LovelyData?

Myšlenku založit LovelyData jsem probíral s několika lidmi, kteří se v IT pohybují. Shodli jsme se, že tu chybí nabídka vzdělávání v oblasti využívání dat, která by byla dostupná široké veřejnosti. A která by navíc byla v češtině nebo slovenštině. Naším cílem bylo hned od začátku nabízet kurzy, které mohou využít i lidé, kteří běžně takové kurzy nenavštěvují. Např. náš kurz Python pro analytiky studují nejen programátoři a analytici, ale i konzultanti, manažeři, kontroloři, personalisté nebo lidé z marketingu.

Jaká jsou nejžhavější aktuální témata ve světě IT a nových technologií?

Rozhodně je to Python. To je programovací jazyk, který zpřístupnil IT pro široké publikum, nejen pro programátory. Python dnes najdete všude – od serverů přes weby až po umělou inteligenci. Proto mají o kurzy Pythonu dnes zájem i lidé, kteří se dříve programování vyhýbali.
Pak je určitě zájem o strojové učení, kde dominuje právě Python. Využití machine learningu je stále ještě na začátku a mnoho firem si jeho možnosti teprve osahává. I proto je důležité mít vyškolené pracovníky, kteří tomuto tématu budou rozumět.
Hodně se také začíná mluvit o RPA (Robotic Process Automation). Jde o softwarové roboty, kteří automatizují, a tím zrychlují různé činnosti, které lidé dělají manuálně. Mohou například přijímat e-maily, rozpoznat přiložené faktury, ty pak zadat do účetního systému, a to všechno rychleji, než by to zvládl člověk. Navíc roboti nepotřebují ani přestávky, ani dovolenou. Pro firmy jsou takoví „pracovníci“ určitě lákaví. Zároveň ale tyto pracovníky musí někdo naprogramovat. A to mohou udělat jen lidé.

za rozhovor poděkoval Pavel Kačer