Analista de datos vs. Científico de datos: ¿cuáles son las diferencias?

Publicado en 02 junio 2021

Hora de lectura 11 minutos

Presentada como la profesión más atractiva del siglo XXI, la figura del científico de datos se ha convertido en uno de los perfiles profesionales más cotizados de los últimos años. Empresas de todo el mundo destacan el prestigio que les caracteriza, así como los atractivos salarios que ofrecen con el objetivo de atraer a estos talentos científicos. Este entusiasmo está motivado por el importante crecimiento del volumen de datos digitales que está transformando la forma en que vivimos y trabajamos.

No es de extrañar que cada vez más personas estén interesadas en esta nueva profesión. Pero antes de adentrarse en la ciencia del análisis de datos, resulta esencial informarse sobre las vías disponibles. Por un lado, se anima a que los candidatos interesados inicien su trayectoria identificando las necesidades y exigencias de las empresas; y, por otro lado, a que investiguen sobre las diferencias existentes entre las distintas áreas. Además, se les anima a investigar sobre los cambios que deben realizar a su CV antes de enviar su candidatura.

Dicho esto, surge una pregunta: ¿cuáles son las principales diferencias entre el científico de datos y el analista de datos? Al fin y al cabo, las dos profesiones parecen tener como objetivo común extraer valor económico de los datos. Sin embargo, el hecho de presentar semejanzas no implica necesariamente que sean equivalentes.

El propósito de este artículo es arrojar luz sobre las diferencias entre estas dos profesiones. No solo desde un punto de vista teórico, sino también desde un punto de vista práctico. Para ello, contamos con la visión de Mohamed Warsame, un profesional y formador experto en Data que sabe perfectamente cómo funcionan los equipos de datos en el mundo real.

Analista de datos: profesión, funciones, experiencia profesional

Para poder entender en qué consiste la figura del analista de datos, tomemos como ejemplo un anuncio acerca de un trabajo de analista de datos junior:


Normalmente el trabajo de un analista de datos está centrado en la consultoría, tal y como muestra la descripción del puesto anunciado en Indeed.

La mayoría de las veces se trata de:

  • manipular datos procedentes de hojas de cálculo de Excel y bases de datos SQL.
  • extraer conclusiones relevantes a través de análisis retrospectivos y pruebas A / B.
  • proporcionar asesoramiento empresarial basado en datos.

El último punto ilustra la importancia de conocer y dominar las herramientas de visualización y generación de informes, como la plataforma Tableau y las tablas dinámicas de Excel. Por otro lado, el modelado de datos se limita muchas veces al aprendizaje supervisado básico o a su equivalente estadístico: el análisis de regresión.

Por experiencia, también puedo decir que, a veces, a los novatos se les olvida proporcionar recomendaciones, a menudo el paso más importante. Pueden caer en la trampa de palabras de moda y de técnicas muy alejadas del contexto empresarial. En consecuencia, resulta esencial que el analista de datos aprenda a extraer ideas que puedan ponerse en práctica y a presentarlas de forma visualmente convincente y comprensible. Los analistas de datos son investigadores expertos que saben cómo hacer que sus ideas sean accesibles.

Científico de datos: profesión, funciones, experiencia profesional

Ahora tomamos como ejemplo un anuncio publicado en Indeed sobre el trabajo del científico de datos, de esta manera pretendemos analizar algunas de las principales diferencias. La primera diferencia notable es la longitud de las secciones de «funciones» y «responsabilidad». No cabe duda de que se exige mucho más al científico de datos promedio que al analista de datos, lo cual explica que a los primeros se les pague mejor que a los segundos. Pero ¿esta es la única razón que se esconde detrás del entusiasmo que existe por esta profesión?

Se espera que un científico de datos sea más que un asistente especializado en análisis de datos. Debe posicionarse como un verdadero constructor que utiliza la programación avanzada para crear pipelines que predicen y hacen recomendaciones en entornos de producción con una precisión casi perfecta. En comparación con los analistas, que son más como periodistas de investigación, los científicos de datos están mucho más orientados al desarrollo de productos que a la consultoría.

No obstante, a veces el científico de datos también debe brindar asesoramiento empresarial basado en datos. Algunos creen que el nombre de este perfil profesional se creó con el objetivo de mostrar que se encontraba entre tres campos: matemáticas/estadística, informática y ser especialista en un ámbito.

La siguiente cita lo resume bastante bien: «Un científico de datos debe ser mejor en estadística que cualquier ingeniero informático y mejor en ingeniería de software que cualquier estadístico».

Analista de datos vs. Científico de datos: las principales diferencias

El científico de datos y su relación con los volúmenes de datos

A medida que aumenta el volumen de datos, los desafíos que se plantean son cada vez mayores, al igual que las expectativas. De hecho, a diferencia del analista de datos , a quien se le darían hojas de cálculo de 500.000 filas y 50 columnas el primer día; al científico de datos se le asignarían terabytes de datos desde el primer día para ordenar en decenas de miles de columnas. Todos esperan que él muestre mágicamente el valor y la sabiduría que se esconden detrás de estos volúmenes de datos. Él solo tendrá que asimilar, transformar, explorar y modelar enormes volúmenes de datos desordenados y desestructurados.

Como han dicho algunos grandes autores sobre el tema: el término «científico de datos» evoca las capacidades casi místicas de una persona que recopila fácilmente información de inmensos lagos de datos (o data lakes en inglés, repositorios masivos de almacenamiento de datos, uno de los métodos utilizados por Big Data). ¡El científico de datos se convierte entonces en alguien con poderes sobrenaturales y que sería el Houdini de los datos del siglo XXI!

El científico de datos y su conocimiento más avanzado del código

La ciencia de datos requiere un conocimiento muy profundo del código. A pesar de que el científico de datos y el analista de datos tratan los datos con el mismo propósito, sus enfoques y las herramientas utilizadas difieren considerablemente:

  • El analista de datos trabaja principalmente con el lenguaje SQL para copiar / pegar datos que se pueden manipular en hojas de cálculo y con interfaces de programación como R Studio y Jupyter Notebooks,
  • El científico de datos , en cambio, trabaja más bien en el entorno de computación en la nube (AWS, Databricks, Hadoop, etc.). Es ahí donde asimila, procesa y modela volúmenes de datos cuya magnitud hace que, en la actualidad, se les denomine bajo el nombre de «Big Data».

Esto explica por qué la descripción del puesto de trabajo del científico de datos incluye largas listas de requisitos de programación.

Los nuevos empleados de las grandes empresas heredan inevitablemente montones de scripts y algoritmos personalizados, a veces indocumentados, que deben reemplazar o actualizar. En este contexto, no es sorprendente que las habilidades de programación avanzada sean esenciales, mientras que solo son útiles en unos pocos puestos de analista de datos junior.

El analista de datos y su proximidad a los equipos comerciales

Los analistas de datos están mucho más cerca de los equipos comerciales. De hecho, los puestos de analista de datos son menos exigentes en términos de dominio de los lenguajes de programación. Debido a que el trabajo del científico de datos generalmente está envuelto de misterio, los empleados comunes de una empresa tienden a acudir a los analistas de datos en busca de ayuda. Estos forman un puente de comunicación real entre los equipos comerciales y los científicos de datos.

Este es un fenómeno que he notado a menudo en el mundo empresarial: mientras que el científico de datos tiende a estar más aislado, el analista de datos tiende a involucrarse y a relacionarse más con otros equipos de la empresa, brindando ayuda en diversos temas :

  • optimización de hojas de cálculo de Excel
  • ayuda con las presentaciones de los clientes gracias a teasers analíticos
  • participación en el desempeño general de la empresa proporcionando cuadros de mando

En resumen, el papel del analista de datos es más bien el de un consultor que disfruta trabajando en un contexto macro.

Ahora que hemos identificado las principales diferencias entre estas dos profesiones, ¡echemos un vistazo más de cerca a sus puntos en común!

Analista de datos vs. Científico de datos: ¿cuáles son las similitudes?

Al resaltar los elementos que comparten y los elementos que determinan sus diferencias, nos acercamos a una mejor comprensión de los dos roles. Stephan Kolassa , un blogger científico de datos, intentó delimitar visualmente estas diferencias utilizando un diagrama de Venn (entrada 2403).






Podemos deducir una gran cantidad de aspectos a partir de este diagrama. Entre los más obvios: el hecho de que el rol del científico de datos y el del analista de datos están estrechamente relacionados, ocupando zonas adyacentes entre sí.

Esto significa que, en la práctica, deben trabajar siempre en los mismos equipos. La única excepción es cuando los analistas de datos se integran en equipos de proyectos específicos en el marco de grupos de trabajo Agile.

Suministro de datos para cumplir con los objetivos comerciales de las empresas

Después de determinar los roles de cada uno, nos damos cuenta de que ambas profesiones se ocupan de poner los datos al servicio de los objetivos comerciales y ambas necesitan conocimientos especializados en materia de estadística tradicional.

Altas habilidades comunicativas

El científico de datos y el analista de datos también comparten una zona en el apartado de comunicación: transmitiendo información útil a los líderes empresariales por medio de data stories (el hecho de contar una historia a partir de los datos recogidos), o creando herramientas intuitivas que habiliten toma de decisiones impulsada data driven (basada en datos).

Por lo tanto, se requieren habilidades de comunicación visual y verbal en casi todas las ofertas de empleo para ambos puestos.


Una tendencia de creciente popularidad entre el público

En el gráfico que se encuentra a continuación, usamos un script de Python para cargar los datos de los términos de búsqueda de Google a partir de una fuente de código abierto.


Podemos observar que las dos profesiones tienen otra similitud. Han experimentado una tendencia de popularidad similar en los últimos años, ¡una tendencia exponencial!

Si alguna vez te lo has preguntado, los datos de las tendencias de Google provienen de muestras neutrales de consultas individuales en motores de búsqueda: anonimizadas, clasificadas y agrupadas geográficamente para medir el interés de la audiencia en temas específicos. En 2016, se publicó una actualización importante sobre el manejo de estos datos, haciendo que estos datos fueran accesibles en tiempo real, independientemente de las categorías de los temas. Llevo muchos años trabajando en el tratamiento de estos datos.

Analista de datos vs. Científico de datos - Conclusión (H2)

En resumen, hemos analizado cómo las profesiones de científico de datos y analista de datos presentan similitudes, pero también diferencias entre sí. Tras examinar algunos ejemplos de ofertas de trabajo, llegamos a comprender en qué se diferencian ambas profesiones: el nivel de competencia en lenguajes de programación que exigen, los volúmenes de datos utilizados en el modelado, la sofisticación de la automatización y la formación requerida. No obstante, también descubrimos las similitudes que pueden tener las dos profesiones. De hecho, ambas pretenden extraer enseñanzas de los conjuntos de datos.

Tanto si eres principiante como si tienes un nivel intermedio, puedes realizar una de las formaciones de análisis de datos llevadas a cabo por Wild Code School:

Curso gratuito de Introducción al Big Data

Curso de Analista de Datos

Gracias a estos cursos, podrás adquirir el conocimiento necesario para evolucionar en el competitivo mundo de la transformación digital dominado por los datos, que aportan visualizaciones fantásticas y predicciones que resisten el paso del tiempo.



Fuentes

1) Data Scientist: The Sexiest Job of the 21st Century

2) Data science without knowledge of a specific topic, is it worth pursuing as a career?

3) Google Trends