By Jonny Brooks.
Szavazz a KDnuggets szavazásán, amelyet ez a bejegyzés inspirált:
Adattudomány / gépi tanulás / adatszakma munkával való elégedettsége
Igen, adattudós vagyok, és igen, jól olvastad a címet, de valakinek ki kellett mondania. Annyi történetet olvashatunk arról, hogy az adattudomány a 21. század legdögösebb munkája, és hogy milyen vonzó összegeket lehet keresni adattudósként, hogy ez az abszolút álommunkának tűnhet. Tegyük hozzá, hogy ezen a területen rengeteg magasan képzett ember van, akik komplex problémák megoldásán fáradoznak (igen, a “fáradozás” pozitív dolog), és minden, amiért szeretni lehet ezt a munkát.
Az igazság azonban az, hogy az adattudósok jellemzően “hetente 1-2 órát töltenek új állás keresésével”, ahogy azt a Financial Times cikke is írja. Továbbá a cikk azt is megállapítja, hogy “a gépi tanulással foglalkozó szakemberek 14,3 százalékkal vezetik a listát azok között a fejlesztők között, akik azt mondták, hogy új állást keresnek. Az adattudósok a második helyen álltak, 13,2 százalékkal”. Ezeket az adatokat a Stack Overflow gyűjtötte össze a 64 000 fejlesztőn alapuló felmérésében.
Én is voltam már ebben a helyzetben, és nemrég magam is adattudós állást váltottam.
Miért keres ennyi adattudós új állást?
Mielőtt válaszolnék erre a kérdésre, tisztáznom kell, hogy én még mindig adattudós vagyok. Összességében szeretem ezt a munkát, és nem akarok másokat eltántorítani attól, hogy adattudósnak készüljenek, mert ez szórakoztató, ösztönző és kifizetődő lehet. Ennek a cikknek az a célja, hogy az ördög ügyvédjét játsszam, és feltárjam a munka néhány negatív aspektusát.
Az én szemszögemből nézve, itt van 4 nagy ok, ami miatt szerintem sok adattudós elégedetlen a munkájával.
Az elvárás nem felel meg a valóságnak
A nagy adat olyan, mint a tinédzserszex: mindenki beszél róla, senki sem tudja igazán, hogyan kell csinálni, mindenki azt hiszi, hogy mindenki más csinálja, ezért mindenki azt állítja, hogy csinálja… – Dan Ariely
Az idézet annyira találó. Sok általam ismert junior adattudós (ebbe magam is beletartozom) azért akart az adattudományba bekerülni, mert az egész arról szólt, hogy komplex problémákat oldjunk meg menő új gépi tanulási algoritmusokkal, amelyek óriási hatást gyakorolnak egy vállalkozásra. Ez egy lehetőség volt arra, hogy úgy érezzük, hogy a munka, amit csinálunk, fontosabb, mint bármi, amit eddig csináltunk. Ez azonban gyakran nem így van.
Véleményem szerint az a tény, hogy az elvárás nem felel meg a valóságnak, a végső oka annak, hogy sok adattudós távozik. Ennek számos oka van, és valószínűleg nem tudok kimerítő listával előállni, de ez a bejegyzés lényegében néhány olyan ok felsorolása, amellyel találkoztam.
Minden vállalat más, így nem tudok mindegyikről beszélni, de sok vállalat úgy vesz fel adattudósokat, hogy nincs megfelelő infrastruktúra a helyén ahhoz, hogy elkezdjenek értéket kihozni az AI-ból. Ez hozzájárul az AI hidegindítási problémájához. Ha ezt azzal a ténnyel párosítjuk, hogy ezek a vállalatok nem vesznek fel vezető/tapasztalt adatgyakorlókat a juniorok felvétele előtt, akkor máris megvan a recept a kiábrándult és boldogtalan kapcsolathoz mindkét fél számára. Az adattudós valószínűleg azért jött, hogy okos gépi tanulási algoritmusokat írjon, hogy betekintést nyerjen, de ezt nem tudja megtenni, mert az első feladata az adatinfrastruktúra rendezése és/vagy analitikus jelentések készítése. Ezzel szemben a vállalat csak egy grafikont akart, amelyet minden nap bemutathat az igazgatósági ülésen. A vállalat ezután frusztrált lesz, mert nem látja, hogy az értéket elég gyorsan hajtják, és mindez ahhoz vezet, hogy az adattudós elégedetlen a szerepében.
Véleményem szerint az a tény, hogy az elvárás nem felel meg a valóságnak, a végső oka annak, hogy sok adattudós távozik. Ennek számos oka van, és nem tudok kimerítő listával előállni, de ez a bejegyzés lényegében néhány olyan ok felsorolása, amellyel találkoztam.
Minden vállalat más és más, így nem tudok mindegyikről beszélni, de sok vállalat úgy alkalmazza az adattudósokat, hogy nincs megfelelő infrastruktúra ahhoz, hogy elkezdjenek értéket teremteni az AI-ból. Ez hozzájárul az AI hidegindítási problémájához. Ha ezt azzal a ténnyel párosítjuk, hogy ezek a vállalatok nem vesznek fel vezető/tapasztalt adatgyakorlókat a juniorok felvétele előtt, akkor máris megvan a recept a kiábrándult és boldogtalan kapcsolathoz mindkét fél számára. Az adattudós valószínűleg azért jött, hogy okos gépi tanulási algoritmusokat írjon, hogy betekintést nyerjen, de ezt nem tudja megtenni, mert az első feladata az adatinfrastruktúra rendezése és/vagy analitikus jelentések készítése. Ezzel szemben a vállalat csak egy grafikont akart, amelyet minden nap bemutathat az igazgatósági ülésen. A vállalat ezután frusztrált lesz, mert nem látják, hogy az értéket elég gyorsan hajtják, és mindez ahhoz vezet, hogy az adattudós elégedetlen a szerepében.
Robert Chang egy nagyon éleslátó idézetet adott blogbejegyzésében, amelyben tanácsot ad a junior adattudósoknak:
Nagyon fontos felmérni, hogy törekvéseink mennyire igazodnak a környezetünk kritikus útjához. Keressük meg azokat a projekteket, csapatokat és vállalatokat, amelyek kritikus útvonala a legjobban illeszkedik a miénkhez.”
Ez rávilágít a munkáltató és az adattudós közötti kétirányú kapcsolatra. Ha a vállalat nem a megfelelő helyen van, vagy a céljai nem igazodnak az adattudós céljaihoz, akkor csak idő kérdése, hogy az adattudós találjon valami mást.
Azokat, akiket érdekel, Samson Hu fantasztikus sorozatot írt arról, hogyan épült fel az analitikai csapat a Wishnél, amit én is nagyon tanulságosnak találtam.
Az adattudósok kiábrándulásának másik oka hasonló ahhoz, amiért én kiábrándultam, ami az akadémiát illeti: Azt hittem, hogy képes leszek nagy hatást gyakorolni az emberekre mindenhol, nem csak a vállalaton belül. A valóságban, ha a vállalat alaptevékenysége nem a gépi tanulás (az előző munkáltatóm egy médiakiadó vállalat), akkor valószínű, hogy az általad végzett adattudomány csak kis növekményeket fog nyújtani. Ezek összeadódhatnak valami nagyon jelentős dologgá, vagy lehet szerencséd, ha egy aranybánya projektbe botlasz, de ez ritkábban fordul elő.”
A politika uralkodik
A politikának már egy ragyogó cikket szenteltek: A legnehezebb dolog az adattudományban: a politika, és javaslom, hogy olvassa el. Az első néhány mondat abból a cikkből nagyjából összefoglalja, amit mondani szeretnék:
Amikor reggel 6-kor felkeltem, hogy Support Vector Machines-t tanuljak, arra gondoltam: “Ez tényleg kemény! De hé, legalább nagyon értékes leszek a leendő munkaadóm számára!”. Ha megkaphatnám a DeLoreant, visszamennék az időben, és “Bulls**t!”-nak kiáltanám ki magam.
Ha komolyan azt hiszed, hogy a sok gépi tanulási algoritmus ismerete a legértékesebb adattudóssá tesz, akkor térj vissza a fenti első pontomhoz: az elvárás nem felel meg a valóságnak.
Az igazság az, hogy az üzletben a legnagyobb befolyással rendelkező embereknek jó véleménnyel kell lenniük rólad. Ez azt jelentheti, hogy folyamatosan ad hoc munkát kell végezned, például számokat kell szerezned egy adatbázisból, hogy a megfelelő embereknek a megfelelő időben átadhasd, egyszerű projekteket kell csinálnod, csak azért, hogy a megfelelő emberek megfelelő képet alkossanak rólad. Az előző munkahelyemen sokat kellett ezt tennem. Bármennyire is frusztrálónak tűnhet, ez a munka szükséges része volt.”
3) Te vagy az a személy, akihez fordulhatsz mindenféle adattal kapcsolatban
Azt követően, hogy mindent megteszel azért, hogy a megfelelő emberek kedvében járj, éppen ezek a nagy hatalommal rendelkező emberek gyakran nem értik, mit jelent az “adattudós” kifejezés. Ez azt jelenti, hogy ön lesz az analitikai szakértő, valamint a jelentéstevő fickó, és ne felejtsük el, hogy ön lesz az adatbázis-szakértő is.
Nem csak a nem műszaki vezetők tesznek túl sok feltételezést az ön képességeiről. A többi műszaki területen dolgozó kolléga is feltételezi, hogy mindent tudsz, ami az adatokkal kapcsolatos. Értesz a Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, Tensorflow, A/B tesztelés, NLP, bármilyen gépi tanulás (és minden más adathoz kapcsolódó dolog, ami csak eszedbe jut – mellesleg, ha olyan állásleírást látsz, amire mindezek rá vannak írva, maradj távol tőle. Ez egy olyan cég munkaköri leírásának bűzlik, amelynek fogalma sincs arról, hogy mi az adatstratégiája, és bárkit felvesznek, mert azt hiszik, hogy bármelyik adatszakember felvétele megoldja az összes adatproblémájukat).
De itt még nincs vége. Mivel Ön mindezt tudja, és nyilvánvalóan hozzáférése van MINDEN adathoz, elvárják Öntől, hogy MINDEN kérdésre tudja a választ……. nos, ennek 5 perccel ezelőtt az illetékes személy postaládájában kellett volna landolnia.
Nehéz lehet mindenkinek elmondani, hogy valójában mit tud és mi felett rendelkezik. Nem azért, mert valójában bárki kevesebbet gondolna rólad, hanem azért, mert junior adattudósként, kevés ipari tapasztalattal, aggódni fogsz, hogy az emberek kevesebbet fognak gondolni rólad. Ez elég nehéz helyzet lehet.
4) Elszigetelt csapatban dolgozni
Amikor sikeres adattermékeket látunk, gyakran szakértően megtervezett felhasználói felületeket látunk, intelligens képességekkel, és ami a legfontosabb, hasznos kimenettel, amelyet a felhasználók legalábbis úgy érzékelnek, hogy megold egy releváns problémát. Nos, ha egy adattudós csak azzal tölti az idejét, hogy megtanulja, hogyan kell gépi tanulási algoritmusokat írni és végrehajtani, akkor csak egy kis (bár szükséges) része lehet annak a csapatnak, amely egy értékes terméket előállító projekt sikeréhez vezet. Ez azt jelenti, hogy az elszigetelten dolgozó adattudományi csapatok nehezen fognak értéket teremteni!
Ennek ellenére sok vállalatnál még mindig vannak olyan adattudományi csapatok, amelyek saját projektekkel állnak elő, és kódot írnak, hogy megpróbáljanak megoldani egy problémát. Bizonyos esetekben ez elegendő lehet. Ha például csak egy statikus táblázatra van szükség, amelyet negyedévente egyszer készítenek el, akkor ez némi értéket nyújthat. Másrészt, ha a cél az, hogy optimalizálva intelligens javaslatokat nyújtson egy testreszabott weboldalépítő termékben, akkor ez sokféle készséget igényel, ami nem várható el az adattudósok nagy többségétől (ezt csak az igazi adattudományi unikornis tudja megoldani). Ha tehát a projektet egy elszigetelt adattudományi csapat vállalja el, az nagy valószínűséggel kudarcot vall (vagy nagyon sokáig tart, mert nagyvállalatoknál nem könnyű elszigetelt csapatokat szervezni az együttműködésen alapuló projektre).
Az iparban hatékony adattudósnak lenni tehát nem elég csak a Kaggle-versenyeken jól szerepelni és néhány online tanfolyamot elvégezni. Ehhez (nem)szerencsére (attól függően, hogy melyik oldalról nézzük) hozzátartozik annak megértése, hogyan működnek a hierarchiák és a politika az üzleti életben. A kritikus útvonaladhoz igazodó vállalat megtalálása legyen az egyik fő célod, amikor olyan adattudományi állást keresel, amely kielégíti az igényeidet. Azonban még mindig szükséged lehet arra, hogy újraigazítsd az elvárásaidat azzal kapcsolatban, hogy mit várhatsz el egy adattudományi munkakörtől.
Ha bárkinek további észrevétele, kérdése vagy ellenvetése van, kérjük, nyugodtan kommentáld, mert a konstruktív vitára szükség van ahhoz, hogy a feltörekvő adattudósok megalapozott döntéseket hozzanak a karrierútjukkal kapcsolatban.
Remélem, nem tántorítottalak el a munkától.
Köszönöm, hogy olvastál 🙂
Bio: Jonny Brooks, @Jonny_CBB PhD hallgató és reménybeli adattudós. Szereti a gépi tanulási algoritmusokat, a tudományos kommunikációt és az amerikai focit.
Original. Reposzted with permission.
Related:
- Why Data Scientists Must Focus on Developing Product Sense
- How Do I Get My First Data Science Job?
- A Day in the Life of a Data Scientist: 4. rész
Vélemény, hozzászólás?