1_ BLOG (11).png

Comprendre la data en commençant avec les bases

Publié le 20 novembre 2019

Temps de lecture 4 minutes

Trottinettes électriques, vélos électriques, montres connectées, internet, e-commerce, et encore les réseaux sociaux. Le volume de données à disposition des entreprises de tous les secteurs a littéralement explosé depuis quelques années. 

 

Un volume de Data grandissant

Aujourd’hui, il est possible, pour les grandes entreprises et même les PME, de récupérer des données sur leurs clientèles, sur le marché ou encore sur la concurrence. Maxime Lahy, data scientist chez Keyrus définit la data/donnée ainsi : “la data est toute sorte d’information sous tous types de formes. Ces données peuvent être structurées comme une table de données/tableau Excel ou non structurées comme une vidéo/image.”

Ces ensembles de données devenus si volumineux qu'ils dépassent l'intuition et les capacités humaines d'analyse, ont un nom :  “Big Data”, littéralement “grosses données”. 

Gartner, leader mondial de la recherche et du conseil définit la Big Data en 5V : 

  • Vélocité (référence à la vitesse à laquelle la nouvelle donnée est générée et se déplace. Pensez juste aux messages sur les réseaux sociaux qui deviennent viraux en quelques secondes)
  • Volume (référence aux énormes quantités de données générées chaque seconde. Il suffit de penser à tous les e-mails, tweets, photos, vidéos, les données des capteurs que nous produisons et partageons chaque seconde)
  • Variété (Tableau, base de données, photo, web, audio, social, mobile)
  • Véracité (référence à la fiabilité de la donnée)
  • Valeur (c’est bien beau d’avoir accès aux grosses données mais encore faut-il les transformer en valeur, sinon c’est inutile)
 

Tout le monde est concerné

Tous les secteurs d’entreprise cherchent désormais à exploiter les data / données à leur disposition.

Toutefois, pour être en mesure d’utiliser ces données, les entreprises doivent s’appuyer sur le savoir-faire de professionnels hautement qualifiés et capables d’utiliser les technologies analytiques : Architecte Big Data, Data Engineer, Data Analyst, Data scientist et bien d’autres. 

 

Comprendre les métiers de la Data

Mais quelle est la différence entre tous ces professionnels sachant utiliser ces énormes données ? 


Patrycja-Ewa Klopotowska, recruteuse en Data et Big Data nous explique la différence entre certains de ces métiers. 

“Afin de mieux comprendre qui fait quoi, il faut se baser sur ce document divisé en 3 phases :


STEP 1 - Data Scientist

Le métier qui rentre dans la step 1  (prospection & fédération, catégorisation & process setting) est le Data Scientist. 

Ses tâches consistent à extraire de grandes quantités de données pour identifier les tendances et ensuite examiner des données provenant de sources multiples afin d’appliquer et élaborer de nouvelles méthodes analytiques et statistiques ainsi que des nouveaux modèles de machine learning. 

Le data Analyst conçoit et crée également des rapports et des visualisations dans les données pour mieux comprendre la situation. 

 

STEP 2 - Data Engineer & Data Architect  

Le métier qui rentre dans la step 2 (data engineering) correspond au Data Engineer.

 

Ce dernier, à l’aide du Data Architect, architecture des systèmes distribués et des plates-formes de données en tenant compte de l'évolutivité et de l'intégration continue.Il crée donc des pipelines fiables.

 

STEP 3 - Data Scientist

Finalement, nous retrouvons le métier de Data Scientist à la step 3 (Modélisation/Implémentation). Celui-ci a pour objectif de concevoir et créer des rapports et des visualisations pour mieux comprendre la situation. “

 

Patrycja-Ewa complète également avec le métier de Data Analyst :

“Le data Analyst règle les conflits entre données et créé des statistiques descriptives de base. Il visualise les données et communique les statistiques. Il doit donc avoir des compréhensions de base en statistique. “


Cette dernière appuie également que pour travailler dans la Big data, il faut avoir beaucoup de logique, une bonne capacité d’analyse, de la curiosité et une bonne communication. 


Nous l’avons compris, la data ou Big Data est un sujet complexe mais au coeur de toutes les entreprises. 

Vous avez désormais les bases. Pour aller plus loin, n’hésitez pas à regarder la vidéo de notre formateur Data Patrick Wampé.