La DATA, par où commencer.png

La DATA, par où commencer ?

Publié le 24 mai 2019

Temps de lecture 4 minutes

Notre monde est de plus en plus digital. Le nombre d’objets connectés a littéralement explosé et ce n’est que le commencement : selon IHS, 20 milliards d'objets connectés en 2017 et 75 milliards avant 2025. Avec lui, c’est le nombre de données générées et collectées qui explose à son tour. En conséquence, les entreprises ont de plus en plus besoin de professionnels capables d’analyser ces données pour créer de la valeur.

Bref elles ont besoin de vous !

S’étant démocratisé très récemment, le domaine de la data est vaste et peut être difficile à appréhender pour des apprentis. Par où commencer ?

 

Déjà défrichons un peu. Dire que vous voulez travailler dans la data c’est comme dire que vous voulez être professeur. Professeur de quoi ? C’est tout sauf précis. Comme je vous le disais la data est un domaine vaste et regroupe plusieurs métiers. La 1ère chose à faire est de commencer par vous renseigner sur les métiers de la data et leurs spécificités.

Les 3 métiers les plus souvent mentionnés sont les suivants :

  • Data Analyst : Il récolte et analyse la donnée structurée ou non structurée. Il pratique la dataviz et crée des reportings. Il a une vision data des problématiques de l’entreprise et aide à décider selon un angle data-driven. C’est la porte d’entrée vers les autres métiers de la data.
  • Data Scientist : Il utilise des algorithmes de machine learning sur des données variées. Le but peut être de prédire (prévoir pour être plus précis) l’évolution de la donnée, grouper les données (clustering) pour analyser leurs points communs et différences, et bien d’autres choses.
  • Data ingénieur : Il crée, gère, optimise et sécurise les flux de données de l’entreprise. Sans lui le data analyst et le data scientist n’ont pas accès à leur or noir : la donnée.

Bon maintenant que vous avez une meilleure idée des métiers, par où faut-il commencer si c’est le métier de data analyst qui vous attire ?

Parles-tu le code ?

Un data analyst code dans un ou plusieurs langages de programmation. Le plus utilisé est sans conteste Python. Avec Python on peut créer des sites web, des logiciels ou des jeux vidéos. Mais on peut également faire de l’analyse de données, du machine learning, du web scraping (récupération de données sur le web). Autant de choses dont peut avoir besoin un professionnel de la data. De plus, Python est facile à apprendre, à tel point qu’un article titrait : “ Python en passe de devenir le langage d'apprentissage officiel en France ”. Alors qu’est ce que tu attends pour apprendre les bases ? Après tu pourras passer à des bibliothèques spécialisées dans l’analyse de données comme : Numpy, Pandas, Matplotlib

Quelle jolie base !

Qui dit “données” dit “base de données”. C’est l’endroit où sont stockées vos données. Un data analyst doit savoir interagir avec les bases de données dans leur langage qui est le SQL. Il doit notamment pratiquer le CRUD. Ce n’est pas bien compliqué. Une fois que vous l’aurez fait, vous comprendrez pourquoi certains geek disent : “ CRUD c’est la vie ! ”

Maths un peu ça !

N’ayez pas peur, même si les Maths et vous font exponentiel de 10. Un data analyst doit décrire les données pour pouvoir les analyser. C’est là que les mathématiques entrent en jeu, car les statistiques descriptives et inférentielles (probabilités) permettent justement d’atteindre cet objectif de manière rigoureuse et scientifique. Ils vont muscler votre raisonnement pour vous éviter de tomber dans pas mal de biais cognitifs (erreurs de jugement) qui vous auraient fait confondre corrélation et causalité. Il s’agit de 2 domaines précis des mathématiques, accessibles à tout le monde ! Oui j’ai bien dit tout le monde !

“J’aurais voulu être un artiste ”

Un data analyst pratique la datavisualisation. Ce mot que vous aimeriez bien placer au scrabble signifie tout simplement : qu’il utilise des outils pour visualiser les données de manière esthétique et pertinente, avec un objectif pédagogique. Ne dit-on pas qu’une image vaut mille mots ? Pas la peine d’investir dans un logiciel coûteux, Excel fait très bien les choses, il ne reste plus qu’à en acquérir les bases.

 

Te voilà arrivé à la fin de ce tuto. J’espère que tu y vois déjà plus clair et que tu es encore plus motivé ! Si tu veux acquérir les bases, il ne te reste plus qu’à suivre une formation professionnalisante, puis à toi les tonnes d’offres d’emploi 😉

Un bon exercice pour te tester, celui proposé par la Wild Code School > essaye gratuitement

Une fois l’exercice data validé, tu auras accès à un parcours de préparation qui te permettra d'acquérir toutes les bases nécessaires pour exercer le métier passionnant de Data Analyst. À toi de jouer !