Od Jonnyho Brookse.

Hlasujte v anketě KDnuggets inspirované tímto příspěvkem:
Data Science / Machine Learning / Data Profession Job Satisfaction

Proč tolik datových vědců opouští svá zaměstnání

Ano, jsem datový vědec a ano, nadpis jste četli správně, ale někdo to říct musel. Čteme tolik příběhů o tom, že datová věda je nejšikovnějším zaměstnáním 21. století, a o atraktivních částkách, které si jako datový vědec můžete vydělat, že se to může zdát jako naprosto vysněná práce. Když k tomu připočteme, že tento obor obsahuje množství vysoce kvalifikovaných lidí, kteří se vyžívají v řešení složitých problémů (ano, „vyžívat se“ je pozitivní věc), je na této práci všechno, co se nám může líbit.

Pravdou ale je, že datoví vědci obvykle „stráví 1-2 hodiny týdně hledáním nové práce“, jak uvádí tento článek Financial Times. Dále se v článku také uvádí, že „specialisté na strojové učení jsou na prvním místě jeho seznamu vývojářů, kteří uvedli, že hledají novou práci, a to s 14,3 %. Datoví vědci byli těsně druzí s 13,2 procenty“. Tyto údaje shromáždila společnost Stack Overflow ve svém průzkumu na základě 64 000 vývojářů.

I já jsem byl v této pozici a sám jsem nedávno změnil práci v oblasti datových věd.

Proč tedy tolik datových vědců hledá novou práci?

Než odpovím na tuto otázku, měl bych upřesnit, že jsem stále datový vědec. Celkově mám tuto práci rád a nechci ostatní odrazovat od snahy stát se datovým vědcem, protože to může být zábavné, podnětné a obohacující. Cílem tohoto článku je zahrát si na ďáblova advokáta a odhalit některé negativní aspekty této práce.

Z mého pohledu jsou zde 4 hlavní důvody, proč si myslím, že mnoho datových vědců je se svou prací nespokojeno.

Očekávání neodpovídá realitě

Očekávání neodpovídá realitě

Velká data jsou jako sex teenagerů: všichni o tom mluví, nikdo to ve skutečnosti neumí, všichni si myslí, že to dělají všichni ostatní, a tak všichni tvrdí, že to dělají… – Dan Ariely

Tento citát je velmi výstižný. Mnoho juniorních datových vědců, které znám (to se týká i mě), se chtělo věnovat datové vědě, protože šlo o řešení složitých problémů pomocí nových cool algoritmů strojového učení, které mají obrovský dopad na podnikání. Byla to šance mít pocit, že práce, kterou děláme, je důležitější než cokoli, co jsme dělali předtím. Často tomu tak ale není.

Podle mého názoru je skutečnost, že očekávání neodpovídá realitě, hlavním důvodem, proč mnoho datových vědců odchází. Důvodů je mnoho a není v mých silách přijít s vyčerpávajícím seznamem, ale tento příspěvek je v podstatě výčtem některých důvodů, se kterými jsem se setkal.

Každá společnost je jiná, takže nemohu mluvit za všechny, ale mnoho společností najímá datové vědce bez vhodné infrastruktury, která by umožnila začít z umělé inteligence získávat hodnotu. To přispívá k problému studeného startu v oblasti AI. Když to spojíte se skutečností, že tyto společnosti nenajímají starší/zkušené datové odborníky před tím, než najmou juniory, máte nyní recept na rozčarovaný a nešťastný vztah pro obě strany. Datový odborník pravděpodobně přišel, aby napsal chytré algoritmy strojového učení, které budou řídit vhled, ale nemůže to udělat, protože jeho prvním úkolem je vyřešit datovou infrastrukturu a/nebo vytvořit analytické reporty. Naproti tomu firma chtěla pouze graf, který by mohla každý den prezentovat na zasedání správní rady. Společnost je pak frustrovaná, protože nevidí dostatečně rychle vytvářenou hodnotu, a to vše vede k tomu, že datový vědec je ve své roli nespokojený.

Podle mého názoru je skutečnost, že očekávání neodpovídá realitě, hlavním důvodem, proč mnoho datových vědců odchází. Důvodů je mnoho a není v mých silách přijít s vyčerpávajícím seznamem, ale tento příspěvek je v podstatě výčtem některých důvodů, se kterými jsem se setkal.

Každá společnost je jiná, takže nemohu mluvit za všechny, ale mnoho společností najímá datové vědce bez vhodné infrastruktury, která by umožnila začít z umělé inteligence získávat hodnotu. To přispívá k problému studeného startu v oblasti AI. Když to spojíte se skutečností, že tyto společnosti nenajímají starší/zkušené datové odborníky před tím, než najmou juniory, máte nyní recept na rozčarovaný a nešťastný vztah pro obě strany. Datový odborník pravděpodobně přišel, aby napsal chytré algoritmy strojového učení, které budou řídit vhled, ale nemůže to udělat, protože jeho prvním úkolem je vyřešit datovou infrastrukturu a/nebo vytvořit analytické reporty. Naproti tomu firma chtěla pouze graf, který by mohla každý den prezentovat na zasedání správní rady. Společnost je pak frustrovaná, protože nevidí dostatečně rychle vytvářenou hodnotu, a to vše vede k tomu, že datový vědec je ve své roli nespokojený.

Robert Chang ve svém blogovém příspěvku uvedl velmi trefný citát, v němž dává rady juniorním datovým vědcům:

Je důležité vyhodnotit, jak dobře jsou naše aspirace v souladu s kritickou cestou prostředí, ve kterém se nacházíme. Najděte si projekty, týmy a společnosti, jejichž kritická cesta se nejlépe shoduje s tou vaší.

Tím je zdůrazněn oboustranný vztah mezi zaměstnavatelem a datovým vědcem. Pokud společnost není na správném místě nebo nemá cíle sladěné s cíli datového vědce, pak bude jen otázkou času, než si datový vědec najde něco jiného.

Pro ty, které to zajímá, má Samson Hu fantastický seriál o tom, jak se budoval analytický tým ve společnosti Wish, který mi také přišel velmi zasvěcený.

Dalším důvodem, proč jsou datoví vědci rozčarováni, je podobný důvod, proč jsem byl rozčarován já, což akademická sféra: Věřil jsem, že budu moci mít obrovský vliv na lidi všude, nejen ve firmě. Ve skutečnosti, pokud hlavním předmětem podnikání společnosti není strojové učení (můj předchozí zaměstnavatel je mediální vydavatelství), je pravděpodobné, že datová věda, kterou děláte, přinese jen malé přírůstky. Ty mohou přispět k něčemu velmi významnému, nebo můžete mít štěstí a narazit na projekt se zlatým dolem, ale to je méně časté.

Politika vládne

Tématu politiky je již věnován brilantní článek: Nejtěžší věc v datové vědě: politika a já vás vyzývám, abyste si ho přečetli. Prvních několik vět z tohoto článku v podstatě vystihuje to, co chci říct:

Když jsem vstával v šest ráno, abych studoval Support Vector Machines, říkal jsem si: „Tohle je opravdu těžké! Ale hele, aspoň se stanu velmi cenným pro svého budoucího zaměstnavatele!“. Kdybych si mohl pořídit DeLorean, vrátil bych se v čase a zavolal na sebe „Bulls**t!“

Pokud si vážně myslíte, že znalost spousty algoritmů strojového učení z vás udělá nejcennějšího datového vědce, pak se vraťte k mému prvnímu bodu výše: očekávání neodpovídá realitě.

Pravdou je, že lidé ve firmě, kteří mají největší vliv, vás musí dobře vnímat. To může znamenat, že budete muset neustále vykonávat ad hoc práci, například získávat čísla z databáze, abyste je ve správný čas předali správným lidem, dělat jednoduché projekty jen proto, aby vás ti správní lidé správně vnímali. Na svém předchozím místě jsem to musel dělat často. Jakkoli to může být frustrující, byla to nezbytná součást práce.

3) Jste osobou, za kterou se chodí ohledně čehokoli, co se týká dat

V návaznosti na to, že děláte cokoli, abyste se zavděčili těm správným lidem, ti samí lidé, kteří mají veškerý vliv, často nechápou, co znamená pojem „datový vědec“. To znamená, že budete odborníkem na analytiku i na reporting a nezapomínejme, že budete také odborníkem na databáze.

Nejen netechničtí vedoucí pracovníci si dělají příliš mnoho domněnek o vašich schopnostech. Ostatní kolegové z technických oborů předpokládají, že znáte vše, co souvisí s daty. Vyznáte se ve Sparku, Hadoopu, Hive, Pig, SQL, Neo4J, MySQL, Pythonu, R, Scale, Tensorflow, A/B testování, NLP, čemkoli, co souvisí se strojovým učením (a čemkoli dalším, co souvisí s daty, na co si vzpomenete – BTW pokud uvidíte specifikaci pracovního místa, kde jsou všechny tyto položky napsány, držte se raději dál. Zavání to specifikací práce od společnosti, která vůbec netuší, jaká je její datová strategie, a najme kohokoli, protože si myslí, že najmutím jakéhokoli člověka na data vyřeší všechny své problémy s daty).

Ale tím to nekončí. Protože tohle všechno víte a máte samozřejmě přístup ke VŠEM datům, očekává se, že budete mít odpovědi na VŠECHNY otázky……. no, mělo to přistát ve schránce příslušné osoby před 5 minutami.

Snažit se všem říct, co vlastně víte a máte pod kontrolou, může být těžké. Ne proto, že by si o vás někdo skutečně myslel méně, ale proto, že se jako juniorní datový vědec s malými zkušenostmi v oboru budete obávat, že si o vás lidé budou myslet méně. To může být docela obtížná situace.

4) Práce v izolovaném týmu

Když vidíme úspěšné datové produkty, často vidíme odborně navržená uživatelská rozhraní s inteligentními možnostmi a hlavně užitečným výstupem, který uživatelé přinejmenším vnímají jako řešení relevantního problému. Pokud nyní datový vědec tráví svůj čas pouze tím, že se učí psát a provádět algoritmy strojového učení, pak může být pouze malou (i když nezbytnou) součástí týmu, který vede k úspěchu projektu, jehož výsledkem je hodnotný produkt. To znamená, že týmy datové vědy, které pracují izolovaně, budou jen těžko poskytovat hodnotu!“

Přesto má mnoho společností stále týmy datové vědy, které vymýšlejí vlastní projekty a píší kód, aby se pokusily vyřešit problém. V některých případech to může stačit. Pokud je například potřeba pouze statická tabulka, která se vytváří jednou za čtvrtletí, pak to může poskytovat určitou hodnotu. Na druhou stranu, pokud je cílem optimalizace poskytovat inteligentní návrhy v produktu pro tvorbu webových stránek na míru, pak to bude vyžadovat mnoho různých dovedností, které by neměly být očekávány u drtivé většiny datových vědců (to může vyřešit pouze skutečný jednorožec datové vědy). Pokud se tedy projektu ujme izolovaný tým datových vědců, s největší pravděpodobností selže (nebo bude trvat velmi dlouho, protože zorganizovat izolované týmy pro práci na společném projektu ve velkých podnicích není snadné).

Chcete-li se tedy stát efektivním datovým vědcem v průmyslu, nestačí jen dobře uspět v soutěžích Kaggle a absolvovat několik online kurzů. Zahrnuje to (ne)naštěstí (podle toho, z jakého úhlu pohledu se na to díváte) i pochopení toho, jak v podniku funguje hierarchie a politika. Najít společnost, která je v souladu s vaší kritickou cestou, by mělo být klíčovým cílem při hledání práce v oblasti datové vědy, která uspokojí vaše potřeby. Možná však budete muset ještě upravit svá očekávání ohledně toho, co můžete od pozice v oblasti datové vědy očekávat.

Pokud má někdo další připomínky, dotazy nebo námitky, neváhejte se vyjádřit, protože konstruktivní diskuse je nezbytná, aby pomohla začínajícím datovým vědcům učinit dobře informovaná rozhodnutí o jejich kariérní cestě.

Doufám, že jsem vás od práce neodradil.

Děkuji za přečtení 🙂

Bio: Jonny Brooks, @Jonny_CBB je doktorand a nadějný datový vědec. Miluje algoritmy strojového učení, vědeckou komunikaci a americký fotbal.

Originální. Reposted with permission.

Related:

  • Why Data Scientists Must Focus on Developing Product Sense
  • How Do I Get My First Data Science Job?
  • A Day in the Life of a Data Scientist: Část 4

Jak vypadá váš život v oboru datových technologií?