Por Jonny Brooks.

Vota en la encuesta de KDnuggets inspirada en este post:
Satisfacción laboral con la ciencia de los datos/aprendizaje automático/profesión de los datos

Por qué tantos científicos de datos están dejando sus trabajos

Sí, soy un científico de datos y sí, has leído bien el título, pero alguien tenía que decirlo. Leemos tantas historias sobre la ciencia de los datos como el mejor trabajo del siglo XXI y las atractivas sumas de dinero que puedes ganar como científico de datos que puede parecer el trabajo soñado. Si se tiene en cuenta que este campo contiene una gran cantidad de personas altamente cualificadas que se dedican a resolver problemas complejos (sí, es algo positivo ser «friki»), el trabajo tiene todo lo que se puede desear.

Pero la verdad es que los científicos de datos suelen «pasar entre 1 y 2 horas a la semana buscando un nuevo trabajo», tal y como se afirma en este artículo del Financial Times. Además, el artículo también afirma que «los especialistas en aprendizaje automático encabezan la lista de desarrolladores que dicen estar buscando un nuevo trabajo, con un 14,3%. Los científicos de datos estaban en segundo lugar, con un 13,2%». Estos datos fueron recogidos por Stack Overflow en su encuesta basada en 64.000 desarrolladores.

Yo también he estado en esa posición y recientemente he cambiado de trabajo de ciencia de datos yo mismo.

Entonces, ¿por qué hay tantos científicos de datos buscando nuevos trabajos?

Antes de responder a esa pregunta debo aclarar que sigo siendo un científico de datos. En general, me encanta el trabajo y no quiero desanimar a otros a que aspiren a ser científicos de datos porque puede ser divertido, estimulante y gratificante. El objetivo de este artículo es hacer de abogado del diablo y exponer algunos de los aspectos negativos del trabajo.

Desde mi punto de vista, aquí hay 4 grandes razones por las que creo que muchos científicos de datos están insatisfechos con sus trabajos.

Las expectativas no se ajustan a la realidad

Las expectativas no se ajustan a la realidad

Los grandes datos son como el sexo adolescente: todo el mundo habla de ello, nadie sabe realmente cómo hacerlo, todo el mundo piensa que los demás lo están haciendo, así que todo el mundo afirma que lo están haciendo… – Dan Ariely

Esta cita es muy acertada. Muchos científicos de datos junior que conozco (me incluyo a mí mismo) querían entrar en la ciencia de los datos porque se trataba de resolver problemas complejos con nuevos algoritmos de aprendizaje automático que tienen un gran impacto en un negocio. Era una oportunidad para sentir que el trabajo que estábamos haciendo era más importante que todo lo que habíamos hecho antes. Sin embargo, a menudo no es así.

En mi opinión, el hecho de que las expectativas no se ajusten a la realidad es la razón última por la que muchos científicos de datos se marchan. Hay muchas razones para esto y no puedo llegar a una lista exhaustiva, pero este post es esencialmente una lista de algunas de las razones que he encontrado.

Cada empresa es diferente, así que no puedo hablar por todas ellas, pero muchas empresas contratan científicos de datos sin una infraestructura adecuada para empezar a obtener valor de la IA. Esto contribuye al problema del arranque en frío de la IA. Si a esto le unimos el hecho de que estas empresas no contratan a profesionales de datos con experiencia antes de contratar a jóvenes, tenemos la receta para una relación desilusionada e infeliz para ambas partes. El científico de datos probablemente llegó para escribir algoritmos inteligentes de aprendizaje automático para obtener información, pero no puede hacerlo porque su primer trabajo es ordenar la infraestructura de datos y/o crear informes analíticos. En cambio, la empresa sólo quería un gráfico que pudiera presentar en su reunión de la junta directiva cada día. La empresa entonces se frustra porque no ve que el valor sea impulsado lo suficientemente rápido y todo esto lleva a que el científico de datos sea infeliz en su papel.

En mi opinión, el hecho de que las expectativas no coincidan con la realidad es la razón última por la que muchos científicos de datos se van. Hay muchas razones para esto y no puedo llegar a una lista exhaustiva, pero este post es esencialmente una lista de algunas de las razones que he encontrado.

Cada empresa es diferente, así que no puedo hablar por todas ellas, pero muchas empresas contratan científicos de datos sin una infraestructura adecuada para empezar a obtener valor de la IA. Esto contribuye al problema del arranque en frío de la IA. Si a esto le unimos el hecho de que estas empresas no contratan a profesionales de datos con experiencia antes de contratar a jóvenes, tenemos la receta para una relación desilusionada e infeliz para ambas partes. El científico de datos probablemente llegó para escribir algoritmos inteligentes de aprendizaje automático para obtener información, pero no puede hacerlo porque su primer trabajo es ordenar la infraestructura de datos y/o crear informes analíticos. En cambio, la empresa sólo quería un gráfico que pudiera presentar en su reunión de la junta directiva cada día. La empresa entonces se frustra porque no ven que el valor sea impulsado con la suficiente rapidez y todo esto lleva a que el científico de datos sea infeliz en su papel.

Robert Chang dio una cita muy perspicaz en su entrada de blog dando consejos a los científicos de datos junior:

Es importante evaluar qué tan bien se alinean nuestras aspiraciones con la ruta crítica del entorno en el que estamos. Busca proyectos, equipos y empresas cuya ruta crítica se alinee mejor con la tuya.

Esto pone de manifiesto la relación bidireccional entre el empleador y el científico de datos. Si la empresa no está en el lugar correcto o tiene objetivos alineados con los del científico de datos, entonces sólo será cuestión de tiempo antes de que el científico de datos encuentre otra cosa.

Para aquellos que estén interesados, Samson Hu tiene una serie fantástica sobre cómo se construyó el equipo de análisis en Wish, que también encontré muy perspicaz.

Otra razón por la que los científicos de datos están desilusionados es una razón similar a por la que yo me desilusioné de la academia: Creía que podría tener un gran impacto en la gente de todo el mundo, no sólo dentro de la empresa. En realidad, si el negocio principal de la empresa no es el aprendizaje automático (mi anterior empleador es una empresa editorial de medios de comunicación), es probable que la ciencia de datos que hagas sólo vaya a proporcionar pequeñas ganancias incrementales. Estas pueden sumarse a algo muy significativo o puedes tener la suerte de tropezar con un proyecto de mina de oro, pero esto es menos común.

La política reina

El tema de la política ya tiene un brillante artículo dedicado a ella: Lo más difícil en la ciencia de los datos: la política y os animo a leerlo. Las primeras frases de ese artículo resumen bastante bien lo que quiero decir:

Cuando me levantaba a las 6 de la mañana para estudiar Support Vector Machines pensaba: «¡Esto es realmente difícil! Pero, oye, ¡al menos llegaré a ser muy valioso para mi futuro empleador!». Si pudiera conseguir el DeLorean, retrocedería en el tiempo y me diría «¡Tonterías!».

Si realmente crees que conocer muchos algoritmos de aprendizaje automático te convertirá en el científico de datos más valioso, entonces vuelve a mi primer punto anterior: las expectativas no se ajustan a la realidad.

La verdad es que la gente de la empresa con más peso necesita tener una buena percepción de ti. Eso puede significar que tienes que hacer constantemente un trabajo ad hoc, como obtener números de una base de datos para dárselos a las personas adecuadas en el momento adecuado, haciendo proyectos sencillos sólo para que las personas adecuadas tengan la percepción correcta de ti. Tuve que hacer esto muchas veces en mi anterior puesto. Por frustrante que pueda parecer, era una parte necesaria del trabajo.

3) Eres la persona a la que hay que acudir sobre cualquier cosa relacionada con los datos

Siguiendo con lo de hacer cualquier cosa para complacer a las personas adecuadas, esas mismas personas con toda la influencia a menudo no entienden lo que se entiende por «científico de datos». Esto significa que serás el experto en análisis, así como el encargado de los informes y no olvidemos que también serás el experto en bases de datos.

No son sólo los ejecutivos no técnicos los que hacen demasiadas suposiciones sobre tus habilidades. Otros colegas de la tecnología asumen que sabes todo lo relacionado con los datos. Sabes cómo funciona Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, Tensorflow, A/B Testing, NLP, cualquier cosa relacionada con los datos que se te ocurra. Apesta a una especificación de trabajo de una empresa que no tiene ni idea de cuál es su estrategia de datos y contratarán a cualquiera porque piensan que contratar a cualquier persona de datos solucionará todos sus problemas de datos).

Pero esto no acaba aquí. Debido a que usted sabe todo esto y obviamente tiene acceso a TODOS los datos, se espera que tenga las respuestas a TODAS las preguntas por……. bueno, debería haber aterrizado en la bandeja de entrada de la persona pertinente hace 5 minutos.

Tratar de decirle a todo el mundo lo que realmente sabe y tiene el control puede ser difícil. No porque nadie piense mal de ti, sino porque, como científico de datos junior con poca experiencia en el sector, te preocupa que la gente piense mal de ti. Esto puede ser una situación bastante difícil.

4) Trabajar en un equipo aislado

Cuando vemos productos de datos exitosos, a menudo vemos interfaces de usuario diseñadas por expertos con capacidades inteligentes y, lo que es más importante, un resultado útil que, como mínimo, es percibido por los usuarios para resolver un problema pertinente. Ahora bien, si un científico de datos pasa su tiempo sólo aprendiendo a escribir y ejecutar algoritmos de aprendizaje automático, entonces sólo puede ser una pequeña (aunque necesaria) parte de un equipo que conduce al éxito de un proyecto que produce un producto valioso. Esto significa que los equipos de ciencia de datos que trabajan de forma aislada tendrán dificultades para proporcionar valor.

A pesar de esto, muchas empresas todavía tienen equipos de ciencia de datos que vienen con sus propios proyectos y escriben código para tratar de resolver un problema. En algunos casos esto puede ser suficiente. Por ejemplo, si todo lo que se necesita es una hoja de cálculo estática que se produce una vez al trimestre, entonces puede proporcionar algún valor. Por otro lado, si el objetivo es optimizar la provisión de sugerencias inteligentes en un producto de construcción de sitios web a medida, esto implicará muchas habilidades diferentes que no deberían esperarse para la gran mayoría de los científicos de datos (sólo el verdadero unicornio de la ciencia de datos puede resolver esto). Así que si el proyecto es asumido por un equipo aislado de ciencia de datos lo más probable es que fracase (o que tarde mucho tiempo porque organizar equipos aislados para trabajar en proyectos colaborativos en grandes empresas no es fácil).

Así que para ser un científico de datos eficaz en la industria no basta con hacerlo bien en las competiciones de Kaggle y completar algunos cursos online. Implica (des)afortunadamente (según se mire) entender cómo funcionan las jerarquías y la política en las empresas. Encontrar una empresa que esté alineada con tu camino crítico debería ser un objetivo clave a la hora de buscar un trabajo de ciencia de datos que satisfaga tus necesidades. Sin embargo, es posible que todavía tenga que reajustar sus expectativas de lo que puede esperar de un rol de ciencia de datos.

Si alguien tiene algún comentario adicional, preguntas u objeciones, por favor, siéntase libre de comentar porque la discusión constructiva es necesaria para ayudar a los aspirantes a científicos de datos a tomar decisiones bien informadas sobre su trayectoria profesional.

Espero no haberte desanimado en el trabajo.

Gracias por leer 🙂

Bio: Jonny Brooks, @Jonny_CBB es un estudiante de doctorado y aspirante a científico de datos. Le encantan los algoritmos de aprendizaje automático, la comunicación científica y el fútbol americano.

Original. Reposted with permission.

Related:

  • Why Data Scientists Must Focus on Developing Product Sense
  • How Do I Get My First Data Science Job?
  • A Day in the Life of a Data Scientist: Parte 4