Par Jonny Brooks.

Votez au sondage KDnuggets inspiré par ce post:
Science des données / Apprentissage automatique / Satisfaction professionnelle des données

Pourquoi tant de scientifiques des données quittent leur emploi

Oui, je suis un scientifique des données et oui, vous avez bien lu le titre, mais quelqu’un devait le dire. Nous lisons tellement d’histoires sur la science des données étant cesxiest emploi du 21ème siècle et les sommes d’argent attrayantes que vous pouvez faire en tant que scientifique de données que cela peut sembler être le travail de rêve absolu. Si l’on tient compte du fait que le domaine contient une abondance de personnes hautement qualifiées qui s’adonnent au geeking pour résoudre des problèmes complexes (oui, c’est une chose positive de « geeker »), il y a tout ce qu’il faut pour aimer ce travail.

Mais la vérité est que les data scientists passent généralement « 1 à 2 heures par semaine à chercher un nouvel emploi », comme l’indique cet article du Financial Times. En outre, l’article indique également que « les spécialistes de l’apprentissage automatique sont en tête de sa liste de développeurs qui ont déclaré être à la recherche d’un nouvel emploi, à 14,3 %. Les scientifiques des données arrivaient juste après, à 13,2 pour cent. » Ces données ont été recueillies par Stack Overflow dans leur enquête basée sur 64 000 développeurs.

J’ai moi aussi été dans cette position et j’ai récemment changé d’emploi en science des données moi-même.

Alors, pourquoi tant de data scientists cherchent-ils un nouvel emploi ?

Avant de répondre à cette question, je dois préciser que je suis toujours un data scientist. Dans l’ensemble, j’aime ce travail et je ne veux pas décourager les autres d’aspirer à devenir des data scientists, car cela peut être amusant, stimulant et gratifiant. Le but de cet article est de jouer l’avocat du diable et d’exposer certains des aspects négatifs du travail.

De mon point de vue, voici 4 grandes raisons pour lesquelles je pense que de nombreux data scientists sont insatisfaits de leur travail.

L’attente ne correspond pas à la réalité

L'attente ne correspond pas à la réalité

Les big data, c’est comme le sexe chez les adolescents : tout le monde en parle, personne ne sait vraiment comment le faire, tout le monde pense que tout le monde le fait, alors tout le monde prétend le faire… – Dan Ariely

Cette citation est tellement juste. De nombreux scientifiques de données juniors que je connais (cela m’inclut) voulaient se lancer dans la science des données parce qu’il s’agissait de résoudre des problèmes complexes avec de nouveaux algorithmes d’apprentissage automatique cool qui ont un impact énorme sur une entreprise. C’était l’occasion de sentir que le travail que nous faisions était plus important que tout ce que nous avions fait auparavant. Cependant, ce n’est souvent pas le cas.

À mon avis, le fait que l’attente ne corresponde pas à la réalité est la raison ultime pour laquelle de nombreux data scientists partent. Il y a de nombreuses raisons pour cela et je ne peux probablement pas présenter une liste exhaustive, mais ce post est essentiellement une liste de certaines des raisons que j’ai rencontrées.

Chaque entreprise est différente, donc je ne peux pas parler pour toutes, mais de nombreuses entreprises embauchent des scientifiques de données sans une infrastructure appropriée en place pour commencer à tirer de la valeur de l’IA. Cela contribue au problème du démarrage à froid de l’IA. Si l’on ajoute à cela le fait que ces entreprises ne recrutent pas de spécialistes des données expérimentés avant de recruter des juniors, on obtient la recette d’une relation désillusionnée et malheureuse pour les deux parties. Le spécialiste des données a probablement été recruté pour écrire des algorithmes intelligents d’apprentissage automatique afin de générer des informations, mais il ne peut pas le faire parce que sa première tâche consiste à mettre en place l’infrastructure de données et/ou à créer des rapports analytiques. En revanche, l’entreprise ne voulait qu’un graphique qu’elle pourrait présenter chaque jour à son conseil d’administration. L’entreprise est alors frustrée parce qu’elle ne voit pas de valeur ajoutée assez rapidement et tout cela conduit le data scientist à être malheureux dans son rôle.

À mon avis, le fait que les attentes ne correspondent pas à la réalité est la raison ultime pour laquelle de nombreux data scientists partent. Il y a de nombreuses raisons pour cela et je ne peux probablement pas présenter une liste exhaustive, mais ce post est essentiellement une liste de certaines des raisons que j’ai rencontrées.

Chaque entreprise est différente, donc je ne peux pas parler pour toutes, mais de nombreuses entreprises embauchent des data scientists sans une infrastructure appropriée en place pour commencer à tirer de la valeur de l’IA. Cela contribue au problème du démarrage à froid de l’IA. Si l’on ajoute à cela le fait que ces entreprises ne recrutent pas de spécialistes des données expérimentés avant de recruter des juniors, on obtient la recette d’une relation désillusionnée et malheureuse pour les deux parties. Le spécialiste des données a probablement été recruté pour écrire des algorithmes intelligents d’apprentissage automatique afin de générer des informations, mais il ne peut pas le faire parce que sa première tâche consiste à mettre en place l’infrastructure de données et/ou à créer des rapports analytiques. En revanche, l’entreprise ne voulait qu’un graphique qu’elle pourrait présenter chaque jour à son conseil d’administration. L’entreprise est alors frustrée parce qu’elle ne voit pas la valeur produite assez rapidement et tout cela conduit à ce que le data scientist soit malheureux dans son rôle.

Robert Chang a donné une citation très perspicace dans son billet de blog donnant des conseils aux data scientists juniors :

Il est important d’évaluer dans quelle mesure nos aspirations s’alignent sur le chemin critique de l’environnement dans lequel nous sommes. Trouvez des projets, des équipes et des entreprises dont le chemin critique s’aligne le mieux sur le vôtre.

Cela met en évidence la relation à double sens entre l’employeur et le data scientist. Si l’entreprise n’est pas au bon endroit ou n’a pas des objectifs alignés sur ceux du data scientist, alors ce ne sera qu’une question de temps avant que le data scientist ne trouve autre chose.

Pour ceux qui sont intéressés, Samson Hu a une série fantastique sur la façon dont l’équipe analytique a été construite chez Wish, que j’ai également trouvée très perspicace.

Une autre raison pour laquelle les data scientists sont désillusionnés est une raison similaire à celle pour laquelle j’ai été désillusionné par le milieu universitaire : Je croyais que je serais capable d’avoir un impact énorme sur les gens partout, pas seulement au sein de l’entreprise. En réalité, si le cœur de métier de l’entreprise n’est pas l’apprentissage automatique (mon précédent employeur est une société d’édition de médias), il est probable que la science des données que vous faites ne vous apportera que de petits gains progressifs. Ceux-ci peuvent s’additionner à quelque chose de très significatif ou vous pouvez avoir la chance de tomber sur un projet de mine d’or, mais cela est moins fréquent.

La politique règne en maître

La question de la politique a déjà un brillant article qui lui est consacré : La chose la plus difficile en science des données : la politique et je vous invite à le lire. Les premières phrases de cet article résument assez bien ce que je veux dire :

Lorsque je me réveillais à 6 heures du matin pour étudier les machines à vecteurs de support, je pensais : « C’est vraiment dur ! Mais, hé, au moins je deviendrai très précieux pour mon futur employeur ! ». Si je pouvais obtenir la DeLorean, je retournerais dans le temps et appeler « Bulls**t ! » sur moi-même.

Si vous pensez sérieusement que le fait de connaître beaucoup d’algorithmes d’apprentissage automatique fera de vous le data scientist le plus précieux, alors revenez à mon premier point ci-dessus : les attentes ne correspondent pas à la réalité.

La vérité est que les personnes de l’entreprise qui ont le plus de poids doivent avoir une bonne perception de vous. Cela peut signifier que vous devez constamment faire un travail ad hoc tel que récupérer des chiffres dans une base de données pour les donner aux bonnes personnes au bon moment, faire des projets simples juste pour que les bonnes personnes aient la bonne perception de vous. J’ai dû faire cela souvent dans mon ancien poste. Aussi frustrant que cela puisse paraître, c’était une partie nécessaire du travail.

3) Vous êtes la personne à contacter pour tout ce qui concerne les données

Après avoir fait tout ce qu’il fallait pour plaire aux bonnes personnes, ces mêmes personnes qui ont tout le poids ne comprennent souvent pas ce que l’on entend par « data scientist ». Cela signifie que vous serez l’expert en analyse ainsi que le gars de référence pour les rapports et n’oublions pas que vous serez aussi l’expert en base de données.

Il n’y a pas que les cadres non techniques qui font trop de suppositions sur vos compétences. D’autres collègues du secteur technologique supposent que vous connaissez tout ce qui concerne les données. Vous vous y connaissez en Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, Tensorflow, A/B Testing, NLP, tout ce qui concerne l’apprentissage automatique (et tout ce qui concerne les données auxquelles vous pouvez penser – BTW si vous voyez une spécification de poste avec tout cela écrit dessus, restez bien loin. Cela pue le cahier des charges d’une entreprise qui n’a aucune idée de sa stratégie en matière de données et qui embauche n’importe qui parce qu’elle pense qu’embaucher n’importe quelle personne spécialisée dans les données va résoudre tous ses problèmes de données).

Mais cela ne s’arrête pas là. Parce que vous savez tout cela et que vous avez évidemment accès à TOUTES les données, on s’attend à ce que vous ayez les réponses à TOUTES les questions par……. bien, cela devrait avoir atterri dans la boîte de réception de la personne concernée il y a 5 minutes.

Essayer de dire à tout le monde ce que vous savez réellement et ce que vous contrôlez peut être difficile. Non pas parce que quelqu’un pensera réellement moins de vous, mais parce qu’en tant que data scientist junior avec peu d’expérience dans l’industrie, vous vous inquiéterez que les gens pensent moins de vous. Cela peut être une situation assez difficile.

4) Travailler dans une équipe isolée

Lorsque nous voyons des produits de données réussis, nous voyons souvent des interfaces utilisateur conçues par des experts avec des capacités intelligentes et, surtout, un résultat utile qui, au minimum, est perçu par les utilisateurs pour résoudre un problème pertinent. Or, si un scientifique des données passe son temps à apprendre comment écrire et exécuter des algorithmes d’apprentissage automatique, il ne peut être qu’une petite partie (bien que nécessaire) d’une équipe qui mène à la réussite d’un projet qui produit un produit de valeur. Cela signifie que les équipes de science des données qui travaillent de manière isolée auront du mal à fournir de la valeur !

Malgré cela, de nombreuses entreprises ont encore des équipes de science des données qui viennent avec leurs propres projets et écrivent du code pour essayer de résoudre un problème. Dans certains cas, cela peut suffire. Par exemple, si tout ce dont on a besoin est une feuille de calcul statique qui est produite une fois par trimestre, alors cela peut apporter une certaine valeur. D’un autre côté, si l’objectif est d’optimiser les suggestions intelligentes dans un produit de création de sites Web sur mesure, cela implique de nombreuses compétences différentes qui ne devraient pas être attendues de la grande majorité des scientifiques des données (seule la véritable licorne de la science des données peut résoudre ce problème). Donc, si le projet est pris en charge par une équipe de science des données isolée, il est très probable qu’il échoue (ou qu’il prenne beaucoup de temps parce que l’organisation d’équipes isolées pour travailler sur un projet collaboratif dans les grandes entreprises n’est pas facile).

Donc, pour être un data scientist efficace dans l’industrie, il ne suffit pas de bien faire dans les compétitions Kaggle et de suivre quelques cours en ligne. Cela implique (in)heureusement (selon la façon dont vous le regardez) de comprendre comment les hiérarchies et la politique fonctionnent dans les entreprises. Trouver une entreprise qui est alignée sur votre chemin critique devrait être un objectif clé lors de la recherche d’un emploi en science des données qui répondra à vos besoins. Cependant, il se peut que vous ayez encore besoin de réajuster vos attentes de ce qu’il faut attendre d’un rôle de science des données.

Si quelqu’un a des commentaires supplémentaires, des questions ou des objections, n’hésitez pas à commenter parce qu’une discussion constructive est nécessaire pour aider les aspirants scientifiques des données à prendre des décisions bien informées sur leur cheminement de carrière.

J’espère que je ne vous ai pas rebuté.

Merci de votre lecture 🙂

Bio : Jonny Brooks, @Jonny_CBB est un doctorant et un data scientist plein d’espoir. Aime les algorithmes d’apprentissage automatique, la communication scientifique et le football américain.

Original. Reposé avec permission.

Related:

  • Pourquoi les scientifiques de données doivent se concentrer sur le développement du sens du produit
  • Comment puis-je obtenir mon premier emploi en science des données ?
  • Une journée dans la vie d’un scientifique de données : Partie 4