Datový vědec (Data Scientist) je momentálně jednou z nejžádanějších pozic ve firemních organizacích. Podle mediální společnosti U.S. News & World Report se mezi 100 nejžádanějších povolání pro rok 2023 zařadil datový vědec na 22. místě. Organizace vybavené správnými datovými odborníky totiž mohou ze svých dat vytěžit větší hodnotu. Jedním z hlavních úkolů datového vědce, je „předpovídat“ budoucnost. Je tedy paradox, jak nové technologie zásadně mění povinnosti a činnosti tohoto povolání. K tomu se navíc přidávají další proměnné, které mohou brzy zcela změnit jeho povahu. Kdo to ale ten datový vědec vlastně je? A jak se jím stát?
Datová věda (Data Science) a datový vědec (Data Scientist)
„Vnímání důležitosti data science se v posledních letech výrazně změnilo nejen kvůli nárůstu objemu dat a jejich dostupnosti a pokroku v oblasti technologií pro jejich zpracování, ale zejména díky rostoucímu povědomí o potenciálu, který mohou data v různých oblastech nabízet. Taktéž rostoucí konkurence v mnoha odvětvích nutí firmy a organizace hledat nové a efektivní způsoby využití dat pro zlepšení svých výsledků a zisku,“ říká Jana Večerková, zakladatelka a ředitelka intenzivních kurzů programování Coding Bootcamp Praha.
Datová věda, jak ji definují dnešní odborníci v oboru, je studium a využívání dat pro obchodní rozhodnutí a vytváření nových produktů zaměřených na spotřebitele. Je to příprava, správa, analýza, organizace a matematické zpracování dat, které se používají k vývoji řešení problémů, jimž čelí společnost či jednotlivec. Datoví vědci využívají analytiku, statistiku a software ke správě obrovského množství dat. Obvykle jsou zodpovědní za analýzu dat s cílem nalézt nové poznatky. Často pracují s pokročilými modely strojového učení, které na základě minulých trendů předpovídají budoucí chování zákazníků nebo trhu.
Jak se připravit na kariéru datového vědce?
V dnešním světě je preferovanější správná kombinace dovedností nežli správná kombinace titulů. Přeci jen ale tituly pomáhají pochopit rozsah povinností a platového zařazení. V oblasti datové vědy se však může uplatnit každý, kdo se chce učit a je odhodlaný. Chcete-li začít, můžete prozkoumat mnoho možností online kurzů, bootcampů, workshopů a certifikací. Neexistuje žádná pevně daná cesta, jak se stát datovým vědcem.
„Datová věda je rychle se rozvíjející obor pro všechny, které baví řešit výzvy. Zahrnuje komplexní uvažování o byznysových a společenských problémem a použití technologií s cílem odhalení poznatků z dat. Spojuje v sobě uplatnění logiky i kreativity. Domníváme se tak, že lze přitáhnout mnohem širší okruh zájemců o obor, a proto jsme i připravili ve spolupráci s EY nový kurz Data Science Bootcamp,“ uvedla Jana Večerková, zakladatelka a ředitelka intenzivních kurzů Coding Bootcamp Praha.
3 tipy, jak získat zkušenosti v oboru datové vědy
Pokud dokončujete studium v oboru souvisejícím s datovou vědou, některé z vašich hodin budou praktické projekty. Ty můžete využít k vytvoření portfolia, které ukážete zaměstnavateli.
Další možností, jak získat relevantní pracovní zkušenost, jsou zdroje otevřených dat (open data sources). Otevřenými daty se rozumí data, která jsou přístupná pro úpravu, opakované použití či sdílení komukoli. Vlády, nezávislé organizace a agentury se přihlásily k tomu, aby otevřely brány dat a vytvořily tak více otevřených dat pro volný a snadný přístup. Pokud totiž budou existovat omezení k datům a jejich využívání, myšlenka podnikání a správy řízené daty se nenaplní. Proto mají otevřená data své jedinečné místo. Mohou umožnit plnější pochopení globálních problémů a univerzálních otázek v boji proti nemocem, kriminalitě nebo hladomoru. A dokonce mohou pomoci proměnit způsob, jakým chápeme svět a jakým se do něj zapojujeme. Své znalosti tak může kandidát uplatnit v praxi a provést pozitivní změny, které náš svět potřebuje. To dokáže ohromit nejednoho zaměstnavatele.
A konečně, hackathony jsou skvělým způsobem, jak si vyzkoušet své dovednosti v porovnání s ostatními ve svém oboru a spolupracovat s týmem na projektu. „Tyto soutěže jsou vynikající úvodní zkušeností pro někoho, kdo se chce dostat do oboru datové vědy, protože kopírují týmovou práci, tlak a typ práce, kterou by dělal profesionál datové vědy,“ popisuje Večerková.
Budoucnost je v adaptaci
Dovednosti, které datoví vědci využívají ke své práci, se budou měnit a kódování a umělá inteligence se budou stávat sofistikovanějšími. Souběžně s tím musí být datoví vědci mnohem více orientováni na obchod. Tento posun je částečně způsoben rostoucí složitostí dat. Datové soubory jsou stále větší a různorodější, což ztěžuje získávání poznatků z nich. Nástroje, které datoví vědci používají k analýze dat, staly rozvinutějšími. Roste potřeba, aby datový vědec prosperoval dobrými znalostmi kódování. Totéž platí pro strojové učení (ML).
Automatizace se nevyhnula ani datové vědě
Automatizace v oblasti datové vědy se neustále vyvíjí. Datoví vědci jsou při vytváření modelů AI (umělé inteligence) zodpovědní za dokončení všech úkolů životního cyklu.
Oblasti, ve kterých byla AI implementována do procesu vývoje:
■ Čištění dat – Pro vytvoření jakéhokoli řešení AI je prvním krokem shromáždění relevantních dat. Tato data lze shromažďovat z různých zdrojů. Základním úkolem datového vědce je tedy data vyčistit a připravit. Část čištění zahrnuje formátování, odstraňování chyb a přípravu dat podle potřeby.
■ Vizualizace dat – Data se vizualizují vytvářením grafů, diagramů a dalších vizuálních prvků. K automatizaci procesu vytváření komponent se používají vizualizační nástroje. Analytickou část však stále provádějí datoví vědci.
■ Průběžné monitorování – Všechny modely AI vyžadují po nasazení průběžné monitorování a údržbu. Tyto rutinní údržbové činnosti jsou nutné k zajištění přesnosti modelu v průběhu časového období. K rutinním činnostem se používají automatizované nástroje, v případě potřeby jsou však v obraze stále udržováni datoví vědci s možností lidského zásahu.
Na piedestal přichází týmový duch a kreativita
Vstupujeme do doby, ve které se datová věda stává týmovým sportem více než kdy jindy. Už nejde o to, jak vytvořit model, ale o to, co s ním uděláte, jakmile ho máte. A jak ho zprovoznit ve velkém měřítku, aby byl využitelný v rámci celé organizace. A na to se bude datová věda zaměřovat. Potřeba odborníků, kteří kombinují technické dovednosti v oblastech, jako je statistika a informatika, s odbornými znalostmi z marketingu nebo zdravotnictví, bude jistě růst. Tato kombinace dovedností umožní datovým vědcům nejen dávat smysl složitým datovým souborům, ale také vyvíjet kreativní řešení problémů. Kreativita se stane jednou z klíčových dovedností skvělých datových vědců. (10.5.2023)