Di Jonny Brooks.

Vota nel sondaggio KDnuggets ispirato a questo post:
Data Science / Machine Learning / Data Profession Job Satisfaction

Perché così tanti scienziati di dati stanno lasciando il loro lavoro

Sì, sono uno scienziato di dati e sì, avete letto bene il titolo, ma qualcuno doveva dirlo. Abbiamo letto così tante storie sul fatto che la scienza dei dati è il lavoro più importante del 21° secolo e le allettanti somme di denaro che si possono fare come scienziato dei dati che può sembrare il lavoro dei sogni in assoluto. Fattore che il campo contiene un’abbondanza di persone altamente qualificate che si smanettano per risolvere problemi complessi (sì, è una cosa positiva “smanettare”), c’è tutto da amare su questo lavoro.

Ma la verità è che gli scienziati dei dati in genere “passano 1-2 ore alla settimana a cercare un nuovo lavoro”, come affermato in questo articolo del Financial Times. Inoltre, l’articolo afferma anche che “gli specialisti dell’apprendimento automatico sono in cima alla lista degli sviluppatori che hanno detto di essere alla ricerca di un nuovo lavoro, al 14,3 per cento. Gli scienziati di dati erano un secondo posto, al 13,2 per cento”. Questi dati sono stati raccolti da Stack Overflow nel loro sondaggio basato su 64.000 sviluppatori.

Anche io sono stato in quella posizione e ho recentemente cambiato io stesso il lavoro nella scienza dei dati.

Quindi perché così tanti scienziati dei dati stanno cercando un nuovo lavoro?

Prima di rispondere a questa domanda dovrei chiarire che sono ancora uno scienziato dei dati. Nel complesso, amo questo lavoro e non voglio scoraggiare gli altri dall’aspirare ad essere scienziati dei dati, perché può essere divertente, stimolante e gratificante. Lo scopo di questo articolo è quello di fare l’avvocato del diavolo ed esporre alcuni degli aspetti negativi del lavoro.

Dalla mia prospettiva, ecco 4 grandi motivi per cui penso che molti scienziati dei dati siano insoddisfatti del loro lavoro.

L’aspettativa non corrisponde alla realtà

L'aspettativa non corrisponde alla realtà

I grandi dati sono come il sesso adolescenziale: tutti ne parlano, nessuno sa davvero come farlo, tutti pensano che tutti gli altri lo stiano facendo, quindi tutti sostengono di farlo… – Dan Ariely

Questa citazione è così appropriata. Molti scienziati di dati junior che conosco (incluso me stesso) volevano entrare nella scienza dei dati perché si trattava di risolvere problemi complessi con nuovi algoritmi di apprendimento automatico che hanno un impatto enorme sul business. Era una possibilità di sentire che il lavoro che stavamo facendo era più importante di qualsiasi cosa avessimo fatto prima. Tuttavia, questo spesso non è il caso.

A mio parere, il fatto che l’aspettativa non corrisponda alla realtà è la ragione ultima per cui molti scienziati dei dati lasciano. Ci sono molte ragioni per questo e non posso assolutamente presentare un elenco esaustivo, ma questo post è essenzialmente una lista di alcune delle ragioni che ho incontrato.

Ogni azienda è diversa, quindi non posso parlare per tutte, ma molte aziende assumono scienziati di dati senza un’infrastruttura adatta per iniziare a ottenere valore dall’IA. Questo contribuisce al problema dell’avvio a freddo dell’IA. Se a questo si aggiunge il fatto che queste aziende non riescono ad assumere professionisti dei dati senior/esperti prima di assumere i junior, si ottiene una ricetta per una relazione disillusa e infelice per entrambe le parti. Il data scientist è probabilmente arrivato per scrivere algoritmi intelligenti di machine learning per guidare l’insight, ma non può farlo perché il suo primo lavoro è quello di sistemare l’infrastruttura dei dati e/o creare report analitici. Al contrario, l’azienda voleva solo un grafico da presentare ogni giorno al consiglio di amministrazione. L’azienda diventa frustrata perché non vede che il valore è guidato abbastanza rapidamente e tutto questo porta lo scienziato di dati ad essere infelice nel suo ruolo.

A mio parere, il fatto che l’aspettativa non corrisponde alla realtà è la ragione ultima per cui molti scienziati di dati lasciano. Ci sono molte ragioni per questo e non posso assolutamente fornire un elenco esaustivo, ma questo post è essenzialmente una lista di alcune delle ragioni che ho incontrato.

Ogni azienda è diversa, quindi non posso parlare per tutte, ma molte aziende assumono scienziati di dati senza un’infrastruttura adatta per iniziare a ottenere valore dall’IA. Questo contribuisce al problema dell’avvio a freddo dell’IA. Se a questo si aggiunge il fatto che queste aziende non assumono i professionisti dei dati con esperienza prima di assumere i junior, si ottiene una ricetta per una relazione disillusa e infelice per entrambe le parti. Il data scientist è probabilmente arrivato per scrivere algoritmi di machine learning intelligenti per guidare l’insight, ma non può farlo perché il suo primo lavoro è quello di sistemare l’infrastruttura dei dati e/o creare report analitici. Al contrario, l’azienda voleva solo un grafico da presentare ogni giorno al consiglio di amministrazione. L’azienda diventa frustrata perché non vede che il valore è guidato abbastanza velocemente e tutto questo porta lo scienziato dei dati ad essere infelice nel suo ruolo.

Robert Chang ha fatto una citazione molto perspicace nel suo post sul blog dando consigli agli scienziati dei dati junior:

È importante valutare quanto bene le nostre aspirazioni si allineano con il percorso critico dell’ambiente in cui ci troviamo. Trovate progetti, team e aziende il cui percorso critico sia meglio allineato al vostro.

Questo evidenzia la relazione a due vie tra il datore di lavoro e lo scienziato dei dati. Se l’azienda non è nel posto giusto o ha obiettivi allineati con quelli dello scienziato dei dati, allora sarà solo una questione di tempo prima che lo scienziato dei dati trovi qualcos’altro.

Per coloro che sono interessati Samson Hu ha una serie fantastica su come il team di analisi è stato costruito a Wish che ho trovato anche molto perspicace.

Un altro motivo per cui gli scienziati dei dati sono disillusi è un motivo simile a quello per cui sono stato disilluso dal mondo accademico: Credevo che sarei stato in grado di avere un enorme impatto sulle persone ovunque, non solo all’interno dell’azienda. In realtà, se il core business dell’azienda non è l’apprendimento automatico (il mio precedente datore di lavoro è un’azienda editoriale di media), è probabile che la scienza dei dati che fai fornisca solo piccoli guadagni incrementali. Questi possono sommarsi a qualcosa di molto significativo o si può avere la fortuna di inciampare su un progetto di miniera d’oro, ma questo è meno comune.

La politica regna sovrana

La questione della politica ha già un brillante articolo dedicato ad essa: La cosa più difficile nella scienza dei dati: la politica e vi invito a leggerlo. Le prime frasi di quell’articolo riassumono abbastanza bene quello che voglio dire:

Quando mi svegliavo alle 6 del mattino per studiare le Support Vector Machines pensavo: “Questo è davvero difficile! Ma, ehi, almeno diventerò molto prezioso per il mio futuro datore di lavoro!”. Se potessi avere la DeLorean, tornerei indietro nel tempo e chiamerei me stesso “Bulls**t!”.

Se pensi seriamente che conoscere molti algoritmi di apprendimento automatico ti renderà lo scienziato dei dati più prezioso, allora torna al mio primo punto sopra: l’aspettativa non corrisponde alla realtà.

La verità è che le persone nel business con più potere hanno bisogno di avere una buona percezione di te. Questo può significare che devi costantemente fare un lavoro ad hoc come ottenere numeri da un database da dare alle persone giuste al momento giusto, fare progetti semplici solo per far sì che le persone giuste abbiano la giusta percezione di te. Ho dovuto farlo spesso nel mio posto precedente. Per quanto frustrante possa sembrare, era una parte necessaria del lavoro.

3) Sei la persona a cui rivolgersi per tutto ciò che riguarda i dati

Dopo aver fatto qualsiasi cosa per compiacere le persone giuste, quelle stesse persone con tutto il potere spesso non capiscono cosa si intende per “data scientist”. Questo significa che sarete l’esperto di analisi, così come l’uomo dei rapporti e non dimentichiamo che sarete anche l’esperto di database.

Non sono solo i dirigenti non tecnici a fare troppe supposizioni sulle vostre capacità. Gli altri colleghi della tecnologia danno per scontato che tu sappia tutto ciò che riguarda i dati. Sai come muoverti su Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, Tensorflow, A/B Testing, NLP, qualsiasi cosa di machine learning (e qualsiasi altra cosa relativa ai dati che ti viene in mente – BTW se vedi una specifica di lavoro con tutte queste scritte, stai alla larga. Puzza di un capitolato d’oneri di un’azienda che non ha idea di quale sia la loro strategia sui dati e assumeranno chiunque perché pensano che assumere una qualsiasi persona che si occupa di dati risolverà tutti i loro problemi di dati).

Ma non si ferma qui. Poiché tu sai tutto questo e hai ovviamente accesso a TUTTI i dati, ci si aspetta che tu abbia le risposte a TUTTE le domande da……. bene, dovrebbe essere atterrato nella casella di posta della persona interessata 5 minuti fa.

Tentare di dire a tutti ciò che effettivamente sai e di cui hai il controllo può essere difficile. Non perché qualcuno penserà davvero meno di te, ma perché come scienziato di dati junior con poca esperienza nel settore ti preoccupi che le persone pensino meno di te. Questa può essere una situazione piuttosto difficile.

4) Lavorare in un team isolato

Quando vediamo prodotti di dati di successo, spesso vediamo interfacce utente progettate da esperti con capacità intelligenti e, soprattutto, un output utile che, come minimo, è percepito dagli utenti per risolvere un problema pertinente. Ora, se uno scienziato dei dati spende il suo tempo solo per imparare a scrivere ed eseguire algoritmi di apprendimento automatico, allora può essere solo una piccola (anche se necessaria) parte di un team che porta al successo di un progetto che produce un prodotto di valore. Questo significa che i team di scienza dei dati che lavorano in isolamento faranno fatica a fornire valore!

Nonostante questo, molte aziende hanno ancora team di scienza dei dati che escono con i loro progetti e scrivono codice per cercare di risolvere un problema. In alcuni casi questo può bastare. Per esempio, se tutto ciò che serve è un foglio di calcolo statico che viene prodotto una volta al trimestre, allora può fornire un certo valore. D’altra parte, se l’obiettivo è quello di ottimizzare fornire suggerimenti intelligenti in un prodotto di costruzione di siti web su misura, allora questo coinvolgerà molte competenze diverse che non dovrebbero essere previste per la stragrande maggioranza degli scienziati dei dati (solo il vero unicorno della scienza dei dati può risolvere questo). Quindi, se il progetto è intrapreso da un team isolato di scienziati dei dati è molto probabile che fallisca (o che richieda molto tempo perché organizzare team isolati per lavorare su progetti collaborativi nelle grandi imprese non è facile).

Quindi per essere uno scienziato dei dati efficace nell’industria non è sufficiente solo fare bene nelle competizioni Kaggle e completare alcuni corsi online. Si tratta (dis)fortunatamente (a seconda del modo in cui lo si guarda) di capire come funzionano le gerarchie e la politica negli affari. Trovare un’azienda che sia allineata con il tuo percorso critico dovrebbe essere un obiettivo chiave nella ricerca di un lavoro nella scienza dei dati che soddisfi le tue esigenze. Tuttavia, potresti ancora aver bisogno di riadattare le tue aspettative su cosa aspettarti da un ruolo nella scienza dei dati.

Se qualcuno ha ulteriori commenti, domande o obiezioni, sentiti libero di commentare perché la discussione costruttiva è necessaria per aiutare gli aspiranti scienziati dei dati a prendere decisioni ben informate sul loro percorso di carriera.

Spero di non averti fatto perdere il lavoro.

Grazie per aver letto 🙂

Bio: Jonny Brooks, @Jonny_CBB è uno studente di dottorato e un aspirante scienziato dei dati. Ama gli algoritmi di apprendimento automatico, la comunicazione scientifica e il football americano.

Originale. Reposted with permission.

Related:

  • Perché gli scienziati di dati devono concentrarsi sullo sviluppo del senso del prodotto
  • Come faccio a ottenere il mio primo lavoro nella scienza dei dati?
  • Un giorno nella vita di uno scienziato di dati: Parte 4