De Jonny Brooks.

Votă în sondajul KDnuggets Poll inspirat de această postare:
Data Science / Machine Learning / Data Profession Job Satisfaction

De ce atât de mulți cercetători de date își părăsesc locurile de muncă

Da, sunt un cercetător de date și da, ați citit corect titlul, dar cineva trebuia să o spună. Citim atât de multe povești despre știința datelor ca fiind acestxiest job al secolului 21 și despre sumele atractive de bani pe care le poți câștiga ca cercetător de date, încât poate părea ca fiind jobul absolut de vis. Ținând cont de faptul că acest domeniu conține o abundență de oameni foarte calificați care se dau în vânt pentru a rezolva probleme complexe (da, este un lucru pozitiv să te „dai în vânt”), există totul pentru a iubi acest loc de muncă.

Dar adevărul este că oamenii de știință de date de obicei „petrec 1-2 ore pe săptămână căutând un nou loc de muncă”, așa cum se afirmă în acest articol din Financial Times. Mai mult, în articol se mai spune că „specialiștii în învățare automată se află în fruntea listei sale de dezvoltatori care au declarat că își caută un nou loc de muncă, cu 14,3 %. Cercetătorii de date au fost pe locul al doilea, cu 13,2%”. Aceste date au fost colectate de Stack Overflow în sondajul lor bazat pe 64.000 de dezvoltatori.

Am fost și eu în această poziție și am schimbat recent eu însumi locul de muncă în domeniul științei datelor.

Atunci, de ce sunt atât de mulți oameni de știință de date care își caută un nou loc de muncă?

Înainte de a răspunde la această întrebare, ar trebui să clarific faptul că sunt încă un om de știință de date. În general, îmi place meseria și nu vreau să-i descurajez pe alții să aspire să devină cercetători de date, pentru că poate fi distractiv, stimulativ și plină de satisfacții. Scopul acestui articol este de a face pe avocatul diavolului și de a expune unele dintre aspectele negative ale acestei meserii.

Din punctul meu de vedere, iată 4 mari motive pentru care cred că mulți oameni de știință de date sunt nemulțumiți de munca lor.

Așteptările nu corespund realității

Așteptările nu corespund realității

Big data este ca sexul în adolescență: toată lumea vorbește despre asta, nimeni nu știe cu adevărat cum să o facă, toată lumea crede că toți ceilalți o fac, așa că toată lumea pretinde că o face… – Dan Ariely

Acest citat este atât de potrivit. Mulți cercetători de date juniori pe care îi cunosc (mă includ și pe mine) au vrut să intre în știința datelor pentru că era vorba despre rezolvarea unor probleme complexe cu algoritmi noi și cool de învățare automată care au un impact uriaș asupra unei afaceri. Aceasta a fost o șansă de a simți că munca pe care o făceam era mai importantă decât tot ceea ce am făcut înainte. Cu toate acestea, de multe ori nu este cazul.

În opinia mea, faptul că așteptările nu corespund realității este motivul final pentru care mulți cercetători de date pleacă. Există multe motive pentru acest lucru și nu este posibil să vin cu o listă exhaustivă, dar această postare este, în esență, o listă a unora dintre motivele pe care le-am întâlnit.

Care companie este diferită, așa că nu pot vorbi pentru toate, dar multe companii angajează oameni de știință de date fără a avea o infrastructură adecvată pentru a începe să obțină valoare din AI. Acest lucru contribuie la problema startului la rece în AI. Împreună cu faptul că aceste companii nu reușesc să angajeze practicieni de date seniori/experimentați înainte de a angaja juniori, acum aveți o rețetă pentru o relație dezamăgită și nefericită pentru ambele părți. Cercetătorul de date a venit, probabil, pentru a scrie algoritmi inteligenți de învățare automată care să conducă la o perspectivă, dar nu poate face acest lucru pentru că prima sa sarcină este să aranjeze infrastructura de date și/sau să creeze rapoarte analitice. În schimb, compania dorea doar un grafic pe care să îl poată prezenta în fiecare zi la ședința consiliului de administrație. Compania devine apoi frustrată pentru că nu vede că valoarea este generată suficient de repede și toate acestea duc la faptul că cercetătorul de date este nefericit în rolul său.

În opinia mea, faptul că așteptările nu corespund realității este motivul final pentru care mulți cercetători de date pleacă. Există multe motive pentru acest lucru și nu este posibil să vin cu o listă exhaustivă, dar această postare este, în esență, o listă a unora dintre motivele pe care le-am întâlnit.

Care companie este diferită, așa că nu pot vorbi pentru toate, dar multe companii angajează oameni de știință de date fără o infrastructură adecvată pentru a începe să obțină valoare din AI. Acest lucru contribuie la problema startului la rece în AI. Împreună cu faptul că aceste companii nu reușesc să angajeze practicieni de date seniori/experimentați înainte de a angaja juniori, acum aveți o rețetă pentru o relație dezamăgită și nefericită pentru ambele părți. Cercetătorul de date a venit, probabil, pentru a scrie algoritmi inteligenți de învățare automată care să conducă la o perspectivă, dar nu poate face acest lucru pentru că prima sa sarcină este să aranjeze infrastructura de date și/sau să creeze rapoarte analitice. În schimb, compania dorea doar un grafic pe care să îl poată prezenta în fiecare zi la ședința consiliului de administrație. Compania devine apoi frustrată pentru că nu vede că valoarea este generată suficient de repede și toate acestea duc la faptul că cercetătorul de date este nefericit în rolul său.

Robert Chang a dat un citat foarte perspicace în postarea sa de pe blog, oferind sfaturi pentru cercetătorii de date juniori:

Este important să evaluăm cât de bine se aliniază aspirațiile noastre cu calea critică a mediului în care ne aflăm. Găsiți proiecte, echipe și companii a căror cale critică se aliniază cel mai bine cu a voastră.

Acest lucru evidențiază relația bidirecțională dintre angajator și cercetătorul de date. Dacă compania nu este în locul potrivit sau nu are obiective aliniate cu cele ale omului de știință de date, atunci va fi doar o chestiune de timp până când omul de știință de date va găsi altceva.

Pentru cei interesați, Samson Hu are o serie fantastică despre cum a fost construită echipa de analiză la Wish, pe care am găsit-o, de asemenea, foarte pătrunzătoare.

Un alt motiv pentru care oamenii de știință de date sunt deziluzionați este un motiv similar cu cel pentru care am fost deziluzionat care mediul academic: Am crezut că voi putea avea un impact uriaș asupra oamenilor de pretutindeni, nu doar în cadrul companiei. În realitate, dacă activitatea de bază a companiei nu este învățarea automată (fostul meu angajator este o companie de editare media), este probabil ca știința datelor pe care o faci să ofere doar câștiguri incrementale mici. Acestea se pot adăuga la ceva foarte semnificativ sau puteți fi norocos să dați peste un proiect de mină de aur, dar acest lucru este mai puțin obișnuit.

Politica domnește suprem

Ceea a politicii are deja un articol genial dedicat: Cel mai dificil lucru în știința datelor: politica și vă îndemn să îl citiți. Primele câteva propoziții din acel articol rezumă destul de bine ceea ce vreau să spun:

Când mă trezeam la 6 dimineața pentru a studia Mașinile vectoriale de suport mă gândeam: „Este foarte greu! Dar, hei, cel puțin voi deveni foarte valoros pentru viitorul meu angajator!”. Dacă aș putea face rost de DeLorean, m-aș întoarce în timp și mi-aș spune „Bulls**t!” pe mine însumi.

Dacă credeți în mod serios că știind o mulțime de algoritmi de învățare automată vă va face cel mai valoros cercetător de date, atunci reveniți la primul meu punct de mai sus: așteptările nu corespund realității.

Adevărul este că oamenii din business cu cea mai mare influență trebuie să aibă o percepție bună despre dumneavoastră. Acest lucru poate însemna că trebuie să faceți în mod constant muncă ad-hoc, cum ar fi să obțineți numere dintr-o bază de date pentru a le da oamenilor potriviți la momentul potrivit, să faceți proiecte simple doar pentru ca oamenii potriviți să aibă o percepție corectă despre dvs. A trebuit să fac acest lucru foarte des în locul meu anterior. Oricât de frustrant s-ar putea simți, era o parte necesară a jobului.

3) Sunteți persoana la care trebuie să vă adresați în legătură cu tot ceea ce ține de date

În urma faptului că faceți orice pentru a mulțumi oamenii potriviți, aceiași oameni cu toată influența adesea nu înțeleg ce înseamnă „cercetător de date”. Acest lucru înseamnă că veți fi expertul în analiză, precum și tipul de raportare și să nu uităm că veți fi și expertul în baze de date.

Nu sunt doar directorii non-tehnici care fac prea multe presupuneri cu privire la abilitățile dumneavoastră. Alți colegi din domeniul tehnologiei presupun că știți tot ce ține de date. Știi cum să te descurci cu Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, Tensorflow, A/B Testing, NLP, tot ce ține de machine learning (și orice altceva legat de date la care te poți gândi – BTW, dacă vezi o specificație de job cu toate acestea scrise pe ea, stai bine deoparte. Miroase a specificație de job de la o companie care habar nu are care este strategia lor de date și vor angaja pe oricine pentru că ei cred că angajarea oricărei persoane care se ocupă de date va rezolva toate problemele lor de date).

Dar nu se oprește aici. Pentru că știți toate acestea și, în mod evident, aveți acces la TOATE datele, se așteaptă să aveți răspunsurile la TOATE întrebările prin……. bine, ar fi trebuit să aterizeze în căsuța de e-mail a persoanei relevante cu 5 minute în urmă.

Să încerci să spui tuturor ceea ce știi de fapt și ceea ce ai sub control poate fi greu. Nu pentru că cineva se va gândi de fapt mai puțin la tine, ci pentru că, în calitate de cercetător de date junior cu puțină experiență în industrie, îți vei face griji că oamenii se vor gândi mai puțin la tine. Aceasta poate fi o situație destul de dificilă.

4) Lucrul într-o echipă izolată

Când vedem produse de date de succes, vedem adesea interfețe de utilizator proiectate cu expertiză, cu capacități inteligente și, cel mai important, un rezultat util care, cel puțin, este perceput de utilizatori ca rezolvând o problemă pertinentă. Acum, dacă un cercetător de date își petrece timpul doar învățând cum să scrie și să execute algoritmi de învățare automată, atunci acesta poate fi doar o parte mică (deși necesară) a unei echipe care duce la succesul unui proiect care produce un produs valoros. Acest lucru înseamnă că echipele de data science care lucrează în mod izolat se vor strădui să ofere valoare!

În ciuda acestui fapt, multe companii încă au echipe de data science care vin cu propriile proiecte și scriu cod pentru a încerca să rezolve o problemă. În unele cazuri, acest lucru poate fi suficient. De exemplu, dacă tot ceea ce este necesar este o foaie de calcul statică care este produsă o dată pe trimestru, atunci poate oferi o anumită valoare. Pe de altă parte, dacă obiectivul este de a optimiza furnizarea de sugestii inteligente într-un produs de construire a unui site web personalizat, atunci acest lucru va implica multe abilități diferite, care nu ar trebui să fie de așteptat pentru marea majoritate a oamenilor de știință de date (numai adevăratul unicorn al științei datelor poate rezolva această problemă). Așadar, dacă proiectul este preluat de o echipă izolată de științe de date, cel mai probabil va eșua (sau va dura foarte mult timp, deoarece organizarea unor echipe izolate pentru a lucra la un proiect colaborativ în întreprinderi mari nu este ușoară).

Deci, pentru a fi un cercetător de date eficient în industrie nu este suficient doar să te descurci bine în competițiile Kaggle și să urmezi câteva cursuri online. Din (in)fericire (în funcție de cum privești lucrurile) implică înțelegerea modului în care funcționează ierarhiile și politicile în afaceri. Găsirea unei companii care este aliniată cu calea ta critică ar trebui să fie un obiectiv cheie atunci când cauți un loc de muncă în domeniul științei datelor care să îți satisfacă nevoile. Cu toate acestea, este posibil să fie nevoie să vă reajustați așteptările cu privire la ceea ce vă puteți aștepta de la un rol în domeniul științei datelor.

Dacă cineva are comentarii suplimentare, întrebări sau obiecții, vă rugăm să nu ezitați să comentați, deoarece o discuție constructivă este necesară pentru a-i ajuta pe aspiranții la știința datelor să ia decizii bine informate cu privire la parcursul lor profesional.

Sper că nu v-am descurajat.

Mulțumesc că ați citit 🙂

Bio: Jonny Brooks, @Jonny_CBB este doctorand și cercetător de date de nădejde. Iubește algoritmii de învățare automată, comunicarea științifică și fotbalul american.

Original. Reluat cu permisiune.

Relaționat:

  • De ce oamenii de știință de date trebuie să se concentreze pe dezvoltarea simțului de produs
  • Cum pot obține primul meu loc de muncă în domeniul științei datelor?
  • O zi din viața unui om de știință de date: Partea 4