Comprender la data empezando con las bases

Comprender la data empezando con las bases

Publicado en 10 diciembre 2019

Hora de lectura 3 minutos

Patinetas eléctricas, bicicletas eléctricas, relojes conectados, internet, comercio electrónico, e incluso las redes sociales. El volumen de información a disposición de las empresas en todos los sectores se ha multiplicado literalmente en los últimos años.

 

Un volumen de Data cada vez mayor

Hoy en día, las grandes empresas, e incluso las PYME, pueden recuperar informaciones sobre sus clientes, sobre el mercado o incluso sobre la competencia. Maxime Lahy, data scientist de Keyrus define la data/los datos así: “la data es cualquier tipo de información en todo tipo de forma. Estos datos pueden ser estructurados como una tabla de datos/cuadro Excel o no estructurados como un vídeo/imagen.”

Estos conjuntos de datos, que se han vuelto tan voluminosos que exceden el entendimiento y la capacidad humana de análisis, tienen un nombre: “Big Data”, literalmente “grandes datos”.

Gartner, líder mundial en investigación y consultoría, define el Big Data en 5V:

  • Velocidad (en referencia a la velocidad a la que se genera y se desplaza el dato nuevo. Piensa en los mensajes en las redes sociales que se vuelven virales en cuestión de segundos)

  • Volumen (en referencia a las enormes cantidades de datos generados cada segundo. Basta con pensar en todos los correos electrónicos, tweets, fotos, vídeos, las informaciones de los sensores que generamos y compartimos cada segundo)

  • Variedad (Cuadro, base de datos, foto, web, audio, social, móvil)

  • Veracidad (en referencia a la exactitud de los datos)

  • Valor (es muy bonito tener acceso a los grandes datos pero aún debemos transformarlos en valor, de lo contrario es inútil)

 

Interesa a todos

Todos los sectores de las empresas buscan actualmente sacar provecho de la data/los datos a su disposición.

Sin embargo, para poder utilizar estas informaciones, las empresas deben apoyarse en los conocimientos especializados de profesionales altamente calificados y capaces de utilizar las tecnologías analíticas: Arquitecto Big Data, Data Engineer, Data Analyst, Data Scientist y muchos otros.

 

Comprender las profesiones de la Data

¿Pero cuál es la diferencia entre todos estos profesionales que saben aprovechar estos enormes datos?

Patrycja-Ewa Klopotowska, encargada de la contratación en Data y Big Data, nos explica la diferencia entre algunos de estos oficios.

“Para comprender mejor quién hace qué, hay que basarse en este documento dividido en tres fases:


STEP 1 - Data Scientist 

La profesión que entra en la Fase 1/ Step 1   (prospección & federación, categorización & process setting/ajuste del proceso) es el Data Scientist (Científico de Datos).

Sus tareas consisten en extraer grandes cantidades de datos para identificar las tendencias y, a continuación, examinar los datos procedentes de múltiples fuentes a fin de elaborar y aplicar nuevos métodos analíticos y estadísticos, así como nuevos modelos de machine learning.

El Data Scientist también diseña y crea relaciones y visualizaciones en los datos para comprender mejor la situación.

 

STEP 2 - Data Engineer & Data Architect  

El oficio que entra en la Fase 2/Step 2 (data engineering) corresponde al Data Engineer.

 

Este último, con ayuda del Data Architect, diseña los sistemas distribuidos y las plataformas de datos, teniendo en cuenta la capacidad de ampliación y la integración continua. Crea así conductos fiables.

 

STEP 3 - Data Scientist

Finalmente, encontramos la profesión de Data Scientist en la fase 3/ step 3 (Modelización/Implementación). Este tiene como objetivo diseñar y crear relaciones/similitudes y visualizaciones para comprender mejor la situación.”

 

Patrycja-Ewa complementa también con la profesión de Data Analyst:

 “El data Analyst resuelve los conflictos entre los datos y crea estadísticas descriptivas básicas. Visualiza los datos y comunica las estadísticas. Por lo tanto, debe tener una compresión básica de la  estadística.”


Esta última sostiene también que para trabajar en el Big Data es necesario tener mucha lógica, buena capacidad de análisis, curiosidad y buena comunicación.



Lo entendemos, la data o Big Data es un tema complejo pero que está en el centro de todas las empresas.

Ahora tienes las bases. Para profundizar, no dudes en ver el vídeo de nuestro instructor Data Patrick Wampé.