By Jonny Brooks.

Zagłosuj w ankiecie KDnuggets Poll zainspirowanej tym postem:
Data Science / Machine Learning / Data Profession Job Satisfaction

Why so many data scientists are leaving their jobs

Tak, jestem naukowcem zajmującym się danymi i tak, przeczytałeś tytuł poprawnie, ale ktoś musiał to powiedzieć. Czytamy tak wiele historii o tym, że nauka o danych jest texiest pracy 21 wieku i atrakcyjne sumy pieniędzy, które można zrobić jako naukowiec danych, że może wydawać się jak absolutnej pracy marzeń. Biorąc pod uwagę, że pole zawiera mnóstwo wysoce wykwalifikowanych ludzi, którzy chcą rozwiązywać złożone problemy (tak, to pozytywna rzecz „geek out”), jest wszystko, co można kochać w tej pracy.

Ale prawda jest taka, że naukowcy danych zazwyczaj „spędzają 1-2 godziny tygodniowo szukając nowej pracy”, jak stwierdzono w tym artykule Financial Times. Co więcej, artykuł stwierdza również, że „Specjaliści uczenia maszynowego znaleźli się na szczycie listy programistów, którzy powiedzieli, że szukają nowej pracy, na poziomie 14,3 procent. Naukowcy zajmujący się danymi byli blisko drugiego miejsca, na poziomie 13,2 procent.” Dane te zostały zebrane przez Stack Overflow w ich badaniu opartym na 64 000 programistów.

Ja też byłem w tej pozycji i sam niedawno zmieniłem pracę w dziedzinie nauki o danych.

Dlaczego więc tak wielu naukowców zajmujących się nauką o danych szuka nowej pracy?

Zanim odpowiem na to pytanie, powinienem wyjaśnić, że nadal jestem naukowcem zajmującym się nauką o danych. Ogólnie rzecz biorąc, kocham tę pracę i nie chcę zniechęcać innych do aspirowania do bycia naukowcami danych, ponieważ może to być zabawne, stymulujące i satysfakcjonujące. Celem tego artykułu jest zagranie adwokata diabła i ujawnienie niektórych negatywnych aspektów tej pracy.

Z mojej perspektywy, oto 4 duże powody, dla których myślę, że wielu naukowców danych jest niezadowolonych ze swoich miejsc pracy.

Oczekiwania nie odpowiadają rzeczywistości

Oczekiwania nie odpowiadają rzeczywistości

Big data jest jak nastoletni seks: wszyscy o tym mówią, nikt tak naprawdę nie wie, jak to zrobić, wszyscy myślą, że wszyscy inni to robią, więc wszyscy twierdzą, że to robią… – Dan Ariely

Ten cytat jest tak trafny. Wielu młodszych naukowców danych, których znam (w tym ja), chciało dostać się do nauki o danych, ponieważ chodziło o rozwiązywanie złożonych problemów za pomocą fajnych nowych algorytmów uczenia maszynowego, które mają ogromny wpływ na biznes. To była szansa, aby poczuć, że praca, którą wykonujemy jest ważniejsza niż wszystko, co robiliśmy wcześniej. Jednak często tak nie jest.

W mojej opinii fakt, że oczekiwania nie pokrywają się z rzeczywistością jest ostatecznym powodem, dla którego wielu naukowców danych odchodzi. Istnieje wiele powodów i nie mogę wymyślić wyczerpującej listy, ale ten post jest w zasadzie listą niektórych powodów, które napotkałem.

Każda firma jest inna, więc nie mogę mówić o nich wszystkich, ale wiele firm zatrudnia naukowców zajmujących się danymi bez odpowiedniej infrastruktury, aby rozpocząć uzyskiwanie wartości z AI. To przyczynia się do problemu zimnego startu w AI. W połączeniu z faktem, że firmy te nie zatrudniają starszych/doświadczonych praktyków danych przed zatrudnieniem juniorów, masz teraz przepis na rozczarowany i nieszczęśliwy związek dla obu stron. Data scientist prawdopodobnie przyszedł napisać inteligentne algorytmy uczenia maszynowego do prowadzenia wglądu, ale nie może tego zrobić, ponieważ ich pierwszym zadaniem jest uporządkowanie infrastruktury danych i / lub tworzenie raportów analitycznych. Dla kontrastu, firma chciała tylko wykresu, który mogłaby przedstawić na spotkaniu zarządu każdego dnia. Firma następnie dostać sfrustrowany, ponieważ nie widzą wartość jest napędzany wystarczająco szybko i wszystko to prowadzi do danych naukowiec jest nieszczęśliwy w ich roli.

W mojej opinii, fakt, że oczekiwania nie pasuje do rzeczywistości jest ostatecznym powodem, dlaczego wielu naukowców danych opuścić. Istnieje wiele powodów i nie mogę wymyślić wyczerpującej listy, ale ten post jest w zasadzie listą niektórych powodów, które napotkałem.

Każda firma jest inna, więc nie mogę mówić o nich wszystkich, ale wiele firm zatrudnia naukowców zajmujących się danymi bez odpowiedniej infrastruktury, aby zacząć uzyskiwać wartość z AI. To przyczynia się do problemu zimnego startu w AI. W połączeniu z faktem, że firmy te nie zatrudniają starszych/doświadczonych praktyków danych przed zatrudnieniem juniorów, masz teraz przepis na rozczarowany i nieszczęśliwy związek dla obu stron. Data scientist prawdopodobnie przyszedł napisać inteligentne algorytmy uczenia maszynowego do prowadzenia wglądu, ale nie może tego zrobić, ponieważ ich pierwszym zadaniem jest uporządkowanie infrastruktury danych i / lub tworzenie raportów analitycznych. Dla kontrastu, firma chciała tylko wykresu, który mogłaby przedstawić na spotkaniu zarządu każdego dnia. Firma następnie się sfrustrowany, ponieważ nie widzą wartość jest napędzany wystarczająco szybko i wszystko to prowadzi do danych naukowiec jest nieszczęśliwy w ich roli.

Robert Chang dał bardzo wnikliwy cytat w swoim blogu post dając porady dla młodszych naukowców danych:

To ważne, aby ocenić, jak dobrze nasze aspiracje wyrównać z krytycznej ścieżki środowiska, w którym jesteśmy. Znajdź projekty, zespoły i firmy, których ścieżka krytyczna jest najlepiej dopasowana do Twojej.

To podkreśla dwukierunkową relację między pracodawcą a naukowcem zajmującym się danymi. Jeśli firma nie jest w odpowiednim miejscu lub ma cele wyrównane z tym naukowca danych, to będzie tylko kwestią czasu, zanim naukowiec danych znajdzie coś innego.

Dla tych, którzy są zainteresowani Samson Hu ma fantastyczną serię na temat tego, jak zespół analityczny został zbudowany w Wish, który również znalazłem bardzo wnikliwe.

Innym powodem, że naukowcy danych są rozczarowani jest podobny powód, dlaczego byłem rozczarowany, który akademia: Wierzyłem, że będę w stanie zrobić ogromny wpływ na ludzi wszędzie, nie tylko w firmie. W rzeczywistości, jeśli podstawową działalnością firmy nie jest uczenie maszynowe (mój poprzedni pracodawca jest wydawcą mediów), jest prawdopodobne, że nauka o danych, którą robisz, zapewni tylko małe przyrostowe zyski. Te mogą się sumować do czegoś bardzo znaczącego lub możesz mieć szczęście natknąć się na projekt kopalni złota, ale jest to mniej powszechne.

Politics reigns supreme

Kwestia polityki ma już genialny artykuł jej poświęcony: The most difficult thing in data science: politics i zachęcam do jego przeczytania. Kilka pierwszych zdań z tego artykułu całkiem dobrze podsumowuje to, co chcę powiedzieć:

Kiedy budziłem się o 6 rano, aby studiować Support Vector Machines, myślałem: „To jest naprawdę trudne! Ale, hej, przynajmniej stanę się bardzo wartościowy dla mojego przyszłego pracodawcy!”. Gdybym mógł dostać DeLoreana, cofnąłbym się w czasie i zawołał „Bulls**t!” na siebie.

Jeśli poważnie myślisz, że znajomość mnóstwa algorytmów uczenia maszynowego uczyni Cię najbardziej wartościowym naukowcem od danych, to wróć do mojego pierwszego punktu powyżej: oczekiwania nie pokrywają się z rzeczywistością.

Prawda jest taka, że ludzie w biznesie z największą siłą przebicia muszą mieć o Tobie dobre zdanie. To może oznaczać, że trzeba stale wykonywać pracę ad hoc, takie jak uzyskanie numerów z bazy danych, aby dać do właściwych ludzi we właściwym czasie, robi proste projekty tylko tak, że właściwi ludzie mają właściwe postrzeganie Ciebie. W moim poprzednim miejscu pracy musiałem robić to bardzo często. Tak frustrujące, jak to może czuć, to była niezbędna część pracy.

3) Jesteś go do osoby o wszystko danych

Po zrobieniu wszystko, aby zadowolić właściwych ludzi, te same osoby z całej siły często nie rozumieją, co to znaczy „data scientist”. Oznacza to, że będziesz ekspertem analityki, jak również go-to raportowania facet i nie zapominajmy, że będziesz ekspertem bazy danych zbyt.

To nie jest tylko nietechniczne kierownictwo, które sprawiają, że zbyt wiele założeń na temat swoich umiejętności. Inni koledzy z branży technologicznej zakładają, że znasz się na wszystkim, co związane z danymi. Znasz się na Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, Tensorflow, testach A/B, NLP, uczeniu maszynowym (i wszystkim innym związanym z danymi, o czym możesz pomyśleć – BTW, jeśli zobaczysz specyfikację pracy z tym wszystkim, trzymaj się z daleka. To pachnie specyfikacją pracy z firmy, która nie ma pojęcia, jaka jest ich strategia dotycząca danych i zatrudni kogokolwiek, ponieważ myśli, że zatrudnienie jakiejkolwiek osoby zajmującej się danymi rozwiąże wszystkie ich problemy z danymi).

Ale to nie koniec. Ponieważ wiesz to wszystko i oczywiście masz dostęp do WSZYSTKICH danych, oczekuje się, że będziesz miał odpowiedzi na WSZYSTKIE pytania……. cóż, powinny one wylądować w skrzynce odbiorczej odpowiedniej osoby 5 minut temu.

Próba powiedzenia wszystkim, co tak naprawdę wiesz i nad czym masz kontrolę, może być trudna. Nie dlatego, że ktoś faktycznie będzie myślał o tobie mniej, ale dlatego, że jako młodszy naukowiec danych z niewielkim doświadczeniem w branży będziesz się martwić, że ludzie będą myśleć o tobie mniej. To może być dość trudna sytuacja.

4) Praca w odizolowanym zespole

Gdy widzimy udane produkty danych, często widzimy fachowo zaprojektowane interfejsy użytkownika z inteligentnymi możliwościami, a co najważniejsze, użyteczne wyjście, które, co najmniej, jest postrzegane przez użytkowników jako rozwiązanie istotnego problemu. Teraz, jeśli data scientist spędza swój czas tylko ucząc się, jak pisać i wykonywać algorytmy uczenia maszynowego, to może być tylko małą (aczkolwiek niezbędną) częścią zespołu, który prowadzi do sukcesu projektu, który wytwarza wartościowy produkt. Oznacza to, że zespoły data science, które pracują w izolacji, będą walczyć o dostarczenie wartości!

Mimo to wiele firm nadal ma zespoły data science, które wymyślają własne projekty i piszą kod, aby spróbować rozwiązać problem. W niektórych przypadkach może to wystarczyć. Na przykład, jeśli wszystko, co jest potrzebne, to statyczny arkusz kalkulacyjny, który jest produkowany raz na kwartał, to może to stanowić pewną wartość. Z drugiej strony, jeśli celem jest optymalizacja dostarczania inteligentnych sugestii w produkcie do budowania stron internetowych na zamówienie, będzie to wymagało wielu różnych umiejętności, które nie powinny być oczekiwane dla większości naukowców danych (tylko prawdziwy jednorożec nauki o danych może rozwiązać ten jeden). Jeśli więc projekt zostanie podjęty przez odizolowany zespół data science, najprawdopodobniej zakończy się niepowodzeniem (lub zajmie bardzo dużo czasu, ponieważ zorganizowanie odizolowanych zespołów do pracy nad wspólnym projektem w dużych przedsiębiorstwach nie jest łatwe).

Więc, aby być efektywnym data scientist w przemyśle nie wystarczy tylko dobrze radzić sobie w konkursach Kaggle i ukończyć kilka kursów online. To (nie)na szczęście (w zależności od tego, jak na to spojrzeć) wymaga zrozumienia, jak działa hierarchia i polityka w biznesie. Znalezienie firmy, która jest dostosowana do Twojej ścieżki krytycznej, powinno być kluczowym celem podczas poszukiwania pracy w dziedzinie nauki o danych, która zaspokoi Twoje potrzeby. Jednak nadal może być konieczne ponowne dostosowanie swoich oczekiwań dotyczących tego, czego można oczekiwać od roli nauki o danych.

Jeśli ktokolwiek ma dodatkowe uwagi, pytania lub zastrzeżenia, prosimy o komentarz, ponieważ konstruktywna dyskusja jest niezbędna, aby pomóc aspirującym naukowcom danych podjąć dobrze poinformowane decyzje dotyczące ich ścieżki kariery.

Mam nadzieję, że nie odłożyłem cię od pracy.

Dziękuję za przeczytanie 🙂

Bio: Jonny Brooks, @Jonny_CBB to doktorant i pełen nadziei data scientist. Uwielbia algorytmy uczenia maszynowego, komunikację naukową i futbol amerykański.

Original. Reposted with permission.

Related:

  • Why Data Scientists Must Focus on Developing Product Sense
  • How Do I Get My First Data Science Job?
  • A Day in the Life of a Data Scientist: Część 4

.