von Jonny Brooks.
Stimmen Sie in der KDnuggets-Umfrage ab, die durch diesen Beitrag inspiriert wurde:
Datenwissenschaft / Maschinelles Lernen / Datenberufszufriedenheit
Ja, ich bin Datenwissenschaftler und ja, Sie haben den Titel richtig gelesen, aber jemand musste es sagen. Wir lesen so viele Geschichten darüber, dass Datenwissenschaft der heißeste Job des 21. Jahrhunderts ist und dass man als Datenwissenschaftler so viel Geld verdienen kann, dass es wie der absolute Traumjob erscheinen kann. Wenn man dann noch bedenkt, dass es in diesem Bereich eine Fülle hochqualifizierter Menschen gibt, die sich mit der Lösung komplexer Probleme beschäftigen (ja, es ist eine positive Sache, sich „auszutoben“), kann man den Job nur lieben.
Die Wahrheit ist jedoch, dass Datenwissenschaftler in der Regel „1-2 Stunden pro Woche mit der Suche nach einem neuen Job verbringen“, wie in diesem Artikel der Financial Times festgestellt wird. Außerdem heißt es in dem Artikel, dass „Spezialisten für maschinelles Lernen mit 14,3 Prozent die Liste der Entwickler anführten, die angaben, einen neuen Job zu suchen. Datenwissenschaftler lagen mit 13,2 Prozent knapp dahinter.“ Diese Daten wurden von Stack Overflow in einer Umfrage unter 64.000 Entwicklern erhoben.
Auch ich war in dieser Position und habe vor kurzem selbst den Job in der Datenwissenschaft gewechselt.
Warum also suchen so viele Datenwissenschaftler nach einem neuen Job?
Bevor ich diese Frage beantworte, sollte ich klarstellen, dass ich immer noch ein Datenwissenschaftler bin. Im Großen und Ganzen liebe ich meine Arbeit und ich möchte andere nicht davon abhalten, Datenwissenschaftler zu werden, denn es kann Spaß machen, anregend und lohnend sein. Ziel dieses Artikels ist es, des Teufels Advokat zu spielen und einige der negativen Aspekte des Jobs aufzuzeigen.
Aus meiner Sicht gibt es vier Hauptgründe, warum ich glaube, dass viele Datenwissenschaftler mit ihrem Job unzufrieden sind.
Die Erwartungen stimmen nicht mit der Realität überein
Big Data ist wie Teenager-Sex: Jeder redet darüber, niemand weiß wirklich, wie man es macht, jeder denkt, dass jeder andere es macht, also behauptet jeder, dass er es macht… – Dan Ariely
Dieses Zitat ist so treffend. Viele Nachwuchswissenschaftler, die ich kenne (dazu gehöre auch ich), wollten in die Datenwissenschaft einsteigen, weil es darum ging, komplexe Probleme mit coolen neuen Algorithmen für maschinelles Lernen zu lösen, die große Auswirkungen auf ein Unternehmen haben. Das war eine Chance, das Gefühl zu haben, dass die Arbeit, die wir machen, wichtiger ist als alles, was wir bisher gemacht haben. Das ist jedoch oft nicht der Fall.
Meiner Meinung nach ist die Tatsache, dass die Erwartungen nicht mit der Realität übereinstimmen, der Hauptgrund, warum viele Datenwissenschaftler das Unternehmen verlassen. Dafür gibt es viele Gründe, und ich kann unmöglich eine erschöpfende Liste aufstellen, aber dieser Beitrag ist im Wesentlichen eine Auflistung einiger der Gründe, die mir begegnet sind.
Jedes Unternehmen ist anders, daher kann ich nicht für alle sprechen, aber viele Unternehmen stellen Datenwissenschaftler ein, ohne dass eine geeignete Infrastruktur vorhanden ist, um den Wert der KI zu nutzen. Dies trägt zu dem Problem des Kaltstarts bei der KI bei. Zusammen mit der Tatsache, dass diese Unternehmen es versäumen, erfahrene Datenwissenschaftler einzustellen, bevor sie Junioren einstellen, ist dies ein Rezept für eine enttäuschte und unglückliche Beziehung für beide Parteien. Der Datenwissenschaftler wurde wahrscheinlich eingestellt, um intelligente Algorithmen für das maschinelle Lernen zu schreiben, um Erkenntnisse zu gewinnen, kann dies aber nicht tun, weil seine erste Aufgabe darin besteht, die Dateninfrastruktur zu ordnen und/oder Analyseberichte zu erstellen. Im Gegensatz dazu wollte das Unternehmen nur ein Diagramm, das es jeden Tag in der Vorstandssitzung präsentieren kann. Das Unternehmen ist dann frustriert, weil es nicht sieht, dass der Wert schnell genug gesteigert wird, und all dies führt dazu, dass der Datenwissenschaftler in seiner Rolle unzufrieden ist.
Meiner Meinung nach ist die Tatsache, dass die Erwartungen nicht mit der Realität übereinstimmen, der eigentliche Grund, warum viele Datenwissenschaftler gehen. Dafür gibt es viele Gründe, und ich kann unmöglich eine erschöpfende Liste aufstellen, aber dieser Beitrag ist im Wesentlichen eine Auflistung einiger der Gründe, die mir begegnet sind.
Jedes Unternehmen ist anders, daher kann ich nicht für alle sprechen, aber viele Unternehmen stellen Datenwissenschaftler ein, ohne dass eine geeignete Infrastruktur vorhanden ist, um den Wert von KI zu nutzen. Dies trägt zu dem Problem des Kaltstarts bei der KI bei. Zusammen mit der Tatsache, dass diese Unternehmen es versäumen, erfahrene Datenwissenschaftler einzustellen, bevor sie Junioren einstellen, ist dies ein Rezept für eine enttäuschte und unglückliche Beziehung für beide Parteien. Der Datenwissenschaftler wurde wahrscheinlich eingestellt, um intelligente Algorithmen für das maschinelle Lernen zu schreiben, um Erkenntnisse zu gewinnen, kann dies aber nicht tun, weil seine erste Aufgabe darin besteht, die Dateninfrastruktur zu ordnen und/oder Analyseberichte zu erstellen. Im Gegensatz dazu wollte das Unternehmen nur ein Diagramm, das es jeden Tag in der Vorstandssitzung präsentieren kann. Das Unternehmen ist dann frustriert, weil es nicht sieht, dass der Wert schnell genug gesteigert wird, und all das führt dazu, dass der Datenwissenschaftler in seiner Rolle unzufrieden ist.
Robert Chang hat in seinem Blogbeitrag ein sehr aufschlussreiches Zitat gegeben, in dem er Ratschläge für junge Datenwissenschaftler gibt:
Es ist wichtig zu bewerten, wie gut unsere Ambitionen mit dem kritischen Pfad der Umgebung, in der wir uns befinden, übereinstimmen. Finden Sie Projekte, Teams und Unternehmen, deren kritischer Pfad am besten mit dem Ihren übereinstimmt.
Dies unterstreicht die zweiseitige Beziehung zwischen dem Arbeitgeber und dem Datenwissenschaftler. Wenn das Unternehmen nicht an der richtigen Stelle sitzt oder Ziele hat, die mit denen des Datenwissenschaftlers übereinstimmen, dann ist es nur eine Frage der Zeit, bis der Datenwissenschaftler etwas anderes findet.
Für diejenigen, die es interessiert, hat Samson Hu eine fantastische Serie darüber, wie das Analyseteam bei Wish aufgebaut wurde, die ich ebenfalls sehr aufschlussreich fand.
Ein weiterer Grund, warum Datenwissenschaftler desillusioniert sind, ist ein ähnlicher Grund, warum ich von der akademischen Welt desillusioniert war: Ich habe geglaubt, dass ich in der Lage sein würde, einen großen Einfluss auf Menschen überall zu haben, nicht nur innerhalb des Unternehmens. Wenn das Kerngeschäft des Unternehmens nicht das maschinelle Lernen ist (mein früherer Arbeitgeber ist ein Medienverlag), wird die Datenwissenschaft, die Sie betreiben, wahrscheinlich nur kleine, inkrementelle Vorteile bringen. Diese können sich zu etwas sehr Bedeutendem summieren, oder Sie haben das Glück, über ein Goldminenprojekt zu stolpern, aber das ist seltener.
Politik regiert
Dem Thema Politik ist bereits ein brillanter Artikel gewidmet: Das Schwierigste in der Datenwissenschaft: Die Politik, und ich empfehle Ihnen dringend, ihn zu lesen. Die ersten paar Sätze aus diesem Artikel fassen ziemlich genau zusammen, was ich sagen möchte:
Als ich um 6 Uhr morgens aufstand, um Support Vector Machines zu studieren, dachte ich: „Das ist wirklich hart! Aber hey, zumindest werde ich für meinen zukünftigen Arbeitgeber sehr wertvoll werden!“. Wenn ich den DeLorean bekommen könnte, würde ich in der Zeit zurückreisen und mir selbst „Bulls**t!“ zurufen.
Wenn Sie ernsthaft glauben, dass die Kenntnis vieler Algorithmen des maschinellen Lernens Sie zum wertvollsten Datenwissenschaftler macht, dann kehren Sie zu meinem ersten Punkt oben zurück: Die Erwartungen stimmen nicht mit der Realität überein.
Die Wahrheit ist, dass die Leute im Unternehmen mit dem größten Einfluss eine gute Wahrnehmung von Ihnen haben müssen. Das kann bedeuten, dass Sie ständig Ad-hoc-Arbeiten erledigen müssen, z. B. Zahlen aus einer Datenbank holen, um sie den richtigen Leuten zur richtigen Zeit zu geben, oder einfache Projekte durchführen, nur damit die richtigen Leute Sie richtig wahrnehmen. In meiner vorherigen Stelle musste ich das sehr oft tun. So frustrierend es auch sein mag, es war ein notwendiger Teil der Arbeit.
3) Sie sind die Anlaufstelle für alles, was mit Daten zu tun hat
Als Folge davon, dass Sie alles tun, um die richtigen Leute zufrieden zu stellen, verstehen genau diese Leute mit all ihrem Einfluss oft nicht, was mit „Datenwissenschaftler“ gemeint ist. Das bedeutet, dass Sie sowohl der Analyseexperte als auch der Berichterstatter sind und, nicht zu vergessen, auch der Datenbankexperte.
Es sind nicht nur nicht-technische Führungskräfte, die zu viele Annahmen über Ihre Fähigkeiten machen. Andere Kollegen aus der Technik gehen davon aus, dass Sie alles wissen, was mit Daten zu tun hat. Sie kennen sich aus mit Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, Tensorflow, A/B-Tests, NLP, maschinellem Lernen (und allem anderen, was mit Daten zu tun hat – wenn Sie übrigens eine Stellenausschreibung sehen, in der all das steht, lassen Sie die Finger davon. Es riecht nach einer Stellenausschreibung eines Unternehmens, das keine Ahnung von seiner Datenstrategie hat und jeden einstellt, weil es glaubt, dass die Einstellung einer beliebigen Datenperson alle seine Datenprobleme lösen wird).
Aber das ist noch nicht alles. Da Sie all das wissen und offensichtlich Zugang zu ALLEN Daten haben, wird von Ihnen erwartet, dass Sie die Antworten auf ALLE Fragen von……. haben, die eigentlich schon vor 5 Minuten im Posteingang der zuständigen Person hätten landen müssen.
Der Versuch, allen zu sagen, was man tatsächlich weiß und worüber man die Kontrolle hat, kann schwierig sein. Nicht, weil irgendjemand weniger von Ihnen halten würde, sondern weil Sie als junger Datenwissenschaftler mit wenig Branchenerfahrung befürchten, dass man weniger von Ihnen halten würde. Das kann eine ziemlich schwierige Situation sein.
4) Arbeiten in einem isolierten Team
Wenn wir erfolgreiche Datenprodukte sehen, sehen wir oft fachmännisch gestaltete Benutzeroberflächen mit intelligenten Funktionen und vor allem eine nützliche Ausgabe, die von den Benutzern zumindest als Lösung für ein relevantes Problem wahrgenommen wird. Wenn nun ein Datenwissenschaftler seine Zeit nur damit verbringt, zu lernen, wie man Algorithmen für maschinelles Lernen schreibt und ausführt, dann kann er nur ein kleiner (wenn auch notwendiger) Teil eines Teams sein, das zum Erfolg eines Projekts führt, das ein wertvolles Produkt hervorbringt. Das bedeutet, dass Data-Science-Teams, die isoliert arbeiten, nur schwer einen Wert schaffen können!
Dessen ungeachtet haben viele Unternehmen immer noch Data-Science-Teams, die ihre eigenen Projekte entwickeln und Code schreiben, um ein Problem zu lösen. In manchen Fällen kann das ausreichen. Wenn zum Beispiel nur eine statische Tabelle benötigt wird, die einmal im Quartal erstellt wird, kann dies einen gewissen Nutzen bringen. Wenn das Ziel jedoch darin besteht, die Bereitstellung intelligenter Vorschläge in einem maßgeschneiderten Produkt für die Erstellung von Websites zu optimieren, dann erfordert dies viele verschiedene Fähigkeiten, die von der großen Mehrheit der Datenwissenschaftler nicht erwartet werden sollten (nur das wahre Einhorn der Datenwissenschaft kann dieses Problem lösen). Wenn das Projekt also von einem isolierten Data-Science-Team in Angriff genommen wird, wird es höchstwahrscheinlich scheitern (oder sehr lange dauern, weil es nicht einfach ist, isolierte Teams für die Arbeit an einem gemeinsamen Projekt in großen Unternehmen zu organisieren).
Um ein effektiver Data Scientist in der Industrie zu sein, reicht es also nicht aus, bei Kaggle-Wettbewerben gut abzuschneiden und einige Online-Kurse zu absolvieren. Zum (Un-)Glück (je nachdem, wie man es betrachtet) muss man auch verstehen, wie Hierarchien und Politik in Unternehmen funktionieren. Ein Unternehmen zu finden, das Ihren Vorstellungen entspricht, sollte eines der Hauptziele bei der Suche nach einem Job in der Datenwissenschaft sein, der Ihren Anforderungen entspricht. Es kann jedoch sein, dass Sie Ihre Erwartungen an eine Data-Science-Stelle neu anpassen müssen.
Wenn Sie weitere Kommentare, Fragen oder Einwände haben, können Sie sich gerne dazu äußern, denn eine konstruktive Diskussion ist notwendig, um angehenden Data Scientists dabei zu helfen, gut informierte Entscheidungen über ihren Karriereweg zu treffen.
Ich hoffe, ich habe Sie nicht abgeschreckt.
Danke fürs Lesen 🙂
Bio: Jonny Brooks, @Jonny_CBB ist ein Doktorand und hoffnungsvoller Datenwissenschaftler. Er liebt maschinelle Lernalgorithmen, Wissenschaftskommunikation und American Football.
Original. Reposted with permission.
Related:
- Warum sich Data Scientists auf die Entwicklung von Produktgespür konzentrieren müssen
- Wie bekomme ich meinen ersten Data Science Job?
- Ein Tag im Leben eines Data Scientist: Teil 4
Schreibe einen Kommentar