Por Jonny Brooks.

>

>

Vot in KDnuggets Poll inspired by this post:
Data Science / Machine Learning / Data Profession Job Satisfaction

>

Porquê tantos cientistas de dados estão deixando seus trabalhos

Sim, eu sou um cientista de dados e sim, você leu o título corretamente, mas alguém tinha que dizê-lo. Lemos tantas histórias sobre a ciência de dados ser o trabalho mais sexy do século 21 e as atraentes somas de dinheiro que você pode fazer como um cientista de dados que pode parecer o trabalho de sonho absoluto. Fator em que o campo contém uma abundância de pessoas altamente habilidosas que procuram resolver problemas complexos (sim, é uma coisa positiva para “geek out”), há tudo o que se pode amar no trabalho.

Mas a verdade é que os cientistas de dados tipicamente “passam 1-2 horas por semana à procura de um novo emprego”, como declarado neste artigo pelo Financial Times. Além disso, o artigo também afirma que “especialistas em aprendizagem de máquinas encabeçaram sua lista de desenvolvedores que disseram estar procurando por um novo emprego, em 14,3 por cento. Os cientistas de dados ficaram em segundo lugar, com 13,2 por cento”. Estes dados foram recolhidos pelo Stack Overflow na sua pesquisa baseada em 64.000 desenvolvedores.

Eu também já estive nessa posição e recentemente mudei de emprego na ciência dos dados.

Então porque é que tantos cientistas de dados estão à procura de novos empregos?

Antes de responder a essa pergunta, devo esclarecer que ainda sou um cientista de dados. No geral, eu amo o trabalho e não quero desencorajar os outros de aspirar a ser cientista de dados porque pode ser divertido, estimulante e gratificante. O objetivo deste artigo é fazer de advogado do diabo e expor alguns dos aspectos negativos do trabalho.

Da minha perspectiva, aqui estão 4 grandes razões pelas quais eu acho que muitos cientistas de dados estão insatisfeitos com seus trabalhos.

Expectação não corresponde à realidade

Expectação não corresponde à realidade

Dados grandes são como sexo na adolescência: todos falam sobre isso, ninguém sabe realmente como fazê-lo, todos pensam que todos os outros o fazem, então todos afirmam que o fazem… – Dan Ariely

Esta citação é tão apropriada. Muitos cientistas de dados juniores que conheço (incluindo eu próprio) queriam entrar na ciência dos dados porque se tratava de resolver problemas complexos com algoritmos de aprendizagem de máquinas novas e fixes que causam um enorme impacto num negócio. Esta era uma chance de sentir que o trabalho que estávamos fazendo era mais importante do que qualquer coisa que já tínhamos feito antes. No entanto, este não é muitas vezes o caso.

Na minha opinião, o facto de a expectativa não corresponder à realidade é a razão final pela qual muitos cientistas de dados saem. Há muitas razões para isso e eu não consigo fazer uma lista exaustiva, mas este post é essencialmente uma lista de algumas das razões que eu encontrei.

Todas as empresas são diferentes, então eu não posso falar por todas elas, mas muitas empresas contratam cientistas de dados sem uma infra-estrutura adequada no local para começar a obter valor fora da IA. Isso contribui para o problema do início frio na IA. Juntamente com o fato de que essas empresas não conseguem contratar profissionais de dados seniores/experientes antes de contratar juniores, você tem agora uma receita para um relacionamento desiludido e infeliz para ambas as partes. O cientista de dados provavelmente veio para escrever algoritmos inteligentes de aprendizagem de máquinas para conduzir a percepção, mas não pode fazer isso porque seu primeiro trabalho é classificar a infra-estrutura de dados e/ou criar relatórios analíticos. Em contraste, a empresa só queria um gráfico que eles pudessem apresentar em sua reunião de diretoria a cada dia. A empresa então fica frustrada porque não vê valor sendo conduzido com rapidez suficiente e tudo isso leva o cientista de dados a ser infeliz em seu papel.

Na minha opinião, o fato de a expectativa não corresponder à realidade é a razão final pela qual muitos cientistas de dados partem. Há muitas razões para isso e eu não consigo fazer uma lista exaustiva, mas este post é essencialmente uma lista de algumas das razões que eu encontrei.

Todas as empresas são diferentes, então eu não posso falar por todas elas, mas muitas empresas contratam cientistas de dados sem uma infra-estrutura adequada no local para começar a obter valor fora da IA. Isso contribui para o problema do início frio na IA. Juntamente com o fato de que essas empresas não conseguem contratar profissionais de dados seniores/experientes antes de contratar juniores, você tem agora uma receita para um relacionamento desiludido e infeliz para ambas as partes. O cientista de dados provavelmente veio para escrever algoritmos inteligentes de aprendizagem de máquinas para conduzir a percepção, mas não pode fazer isso porque seu primeiro trabalho é classificar a infra-estrutura de dados e/ou criar relatórios analíticos. Em contraste, a empresa só queria um gráfico que eles pudessem apresentar em sua reunião de diretoria a cada dia. A empresa então fica frustrada porque não vê valor sendo conduzido com rapidez suficiente e tudo isso leva o cientista de dados a ser infeliz em seu papel.

Robert Chang deu uma citação muito perspicaz em seu post de blog dando conselhos aos cientistas de dados juniores:

É importante avaliar quão bem nossas aspirações se alinham com o caminho crítico do ambiente em que estamos. Encontre projetos, equipes e empresas cujo caminho crítico melhor se alinha com o seu.

Isso destaca a relação de duas vias entre o empregador e o cientista de dados. Se a empresa não está no lugar certo ou tem objetivos alinhados com os do cientista de dados, então será apenas uma questão de tempo até que o cientista de dados encontre outra coisa.

Para aqueles que estão interessados Samson Hu tem uma série fantástica sobre como a equipe de análise foi construída no Wish, que eu também achei muito perspicaz.

Outra razão pela qual os cientistas de dados estão desiludidos é uma razão semelhante à razão pela qual eu estava desiludido com qual academia: Eu acreditava que eu seria capaz de causar um enorme impacto nas pessoas em toda parte, não apenas dentro da empresa. Na realidade, se o negócio principal da empresa não é a aprendizagem mecânica (meu empregador anterior é uma empresa editora de mídia), é provável que a ciência de dados que você faz só vai fornecer pequenos ganhos incrementais. Estes podem somar-se a algo muito significativo ou você pode ter sorte de tropeçar num projeto de mina de ouro, mas isto é menos comum.

Política reina suprema

A questão da política já tem um brilhante artigo dedicado a ela: A coisa mais difícil na ciência dos dados: política e peço-lhe que o leia. As primeiras frases desse artigo resumem muito bem o que eu quero dizer:

Quando eu estava acordando às 6 da manhã para estudar Support Vector Machines eu pensei: “Isto é realmente difícil! Mas, ei, pelo menos eu vou me tornar muito valioso para o meu futuro empregador”. Se eu pudesse pegar o DeLorean, eu voltaria no tempo e chamaria “Bulls**t!” em mim.

Se você pensa seriamente que conhecer muitos algoritmos de aprendizagem de máquinas fará de você o cientista de dados mais valioso, então volte ao meu primeiro ponto acima: a expectativa não corresponde à realidade.

A verdade é que as pessoas no negócio com mais influência precisam ter uma boa percepção de você. Isso pode significar que você tem que fazer constantemente trabalho ad hoc, como obter números de uma base de dados para dar às pessoas certas no momento certo, fazendo projetos simples apenas para que as pessoas certas tenham a percepção certa de você. Eu tive que fazer isto muitas vezes no meu lugar anterior. Por mais frustrante que possa parecer, foi uma parte necessária do trabalho.

3) Você é o go to pessoa sobre qualquer dado

Following on from doing anything to please the right people, aquelas mesmas pessoas com toda a influência muitas vezes não entendem o que significa “cientista de dados”. Isto significa que você será o especialista em análise, bem como o cara que faz relatórios e não vamos esquecer que você também será o especialista em banco de dados.

Não são apenas os executivos não-técnicos que fazem muitas suposições sobre suas habilidades. Outros colegas de tecnologia assumem que você sabe tudo sobre dados relacionados. Você conhece a Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, Tensorflow, A/B Testing, NLP, qualquer coisa de aprendizagem de máquina (e qualquer outro dado relacionado que você possa pensar – BTW se você vir uma especificação de trabalho com todos estes escritos, fique bem claro. Tresanda a uma especificação de trabalho de uma empresa que não tem idéia de qual é sua estratégia de dados e eles contratarão qualquer um porque acham que contratar qualquer pessoa de dados resolverá todos os seus problemas de dados).

Mas não pára por aí. Como você sabe de tudo isso e obviamente tem acesso a TODOS os dados, espera-se que você tenha as respostas para TODAS as perguntas por……. bem, deveria ter pousado na caixa de entrada da pessoa relevante 5 minutos atrás.

Tentando dizer a todos o que você realmente sabe e tem controle pode ser difícil. Não porque alguém vai realmente pensar menos de você, mas porque como um cientista de dados júnior com pouca experiência na indústria você vai se preocupar que as pessoas vão pensar menos de você. Esta pode ser uma situação bastante difícil.

4) Trabalhando em uma equipe isolada

Quando vemos produtos de dados bem sucedidos, muitas vezes vemos interfaces de usuário com capacidades inteligentes e, mais importante, um resultado útil que, no mínimo, é percebido pelos usuários para resolver um problema pertinente. Agora se um cientista de dados gasta seu tempo apenas aprendendo como escrever e executar algoritmos de aprendizagem de máquinas, então eles só podem ser uma pequena (embora necessária) parte de uma equipe que leva ao sucesso de um projeto que produz um produto valioso. Isto significa que equipes de ciência de dados que trabalham isoladamente terão dificuldade em fornecer valor!

Embora isso, muitas empresas ainda têm equipes de ciência de dados que criam seus próprios projetos e escrevem código para tentar resolver um problema. Em alguns casos, isto pode ser suficiente. Por exemplo, se tudo o que é necessário é uma planilha estática que é produzida uma vez por trimestre, então ela pode fornecer algum valor. Por outro lado, se o objetivo é otimizar o fornecimento de sugestões inteligentes em um produto de construção de website sob medida, isso envolverá muitas habilidades diferentes que não devem ser esperadas para a grande maioria dos cientistas de dados (apenas o verdadeiro unicórnio da ciência dos dados pode resolver este). Portanto, se o projeto for assumido por uma equipe isolada de ciência de dados é mais provável que falhe (ou demore muito tempo porque organizar equipes isoladas para trabalhar em projetos colaborativos em grandes empresas não é fácil).

Então para ser um cientista de dados eficaz na indústria não basta apenas fazer bem em competições de Kaggle e completar alguns cursos online. Felizmente (dependendo de como você olha para ele) envolve entender como as hierarquias e a política funcionam nos negócios. Encontrar uma empresa que esteja alinhada com o seu caminho crítico deve ser um objectivo chave na procura de um trabalho de ciência de dados que satisfaça as suas necessidades. No entanto, você ainda pode precisar reajustar suas expectativas sobre o que esperar de uma função de ciência de dados.

Se alguém tiver algum comentário adicional, perguntas ou objeções, por favor sinta-se à vontade para comentar, porque uma discussão construtiva é necessária para ajudar os aspirantes a cientistas de dados a tomar decisões bem informadas sobre seu caminho de carreira.

Espero não tê-lo colocado fora do trabalho.

Obrigado por ler 🙂

Bio: Jonny Brooks, @Jonny_CBB é um estudante de doutoramento e esperançoso cientista de dados. Adora algoritmos de aprendizagem de máquinas, comunicação científica e futebol americano.

Original. Reportado com permissão.

Related:

  • Por que os cientistas de dados devem se concentrar no desenvolvimento do sentido do produto
  • Como eu consigo meu primeiro trabalho em ciências de dados?
  • Um dia na vida de um cientista de dados: Parte 4