Data scientist, data analyst et data engineer... Mais c'est quoi ?
Je ne vous apprends rien si je vous dis que depuis plusieurs années, une quantité astronomique de données (de data par anglicisme) est générée sur l'ensemble du monde qui nous entoure : on parle de Big Data. Que ce soit sur le temps qu'il fera demain, sur les dynamiques économiques d'une entreprise, sur vos habitudes de consommation, sur vos déplacements ou encore sur le nombre de fois que vous avez écouté le dernier album de JUL, les données sont partout.
Et comme vous le savez également, les entreprises ont rapidement compris qu'il était capital de s'appuyer sur ces informations pour prendre des décisions. Ainsi, afin de gérer et/ou d'exploiter au mieux ces données, nous avons vu fleurir un certain nombre de métiers liés à la science des données (data science) généralement rassemblés sous trois bannières : Data Engineer, Data Analyst et Data Scientist.
"Mais c'est quoi la différence ?"
Je ne compte plus le nombre de fois ou on m'a posé cette question! Que ce soit lors de conversations ouvertes, d'échanges avec des gens de la tech (si si...) ou encore lors d'entretiens d'embauche (si si...bis).
Pour que tout le monde parle le même langage et qu'il n'y ait plus de malentendus lors de recrutements, je me suis dit qu'il serait intéressant de faire un article dédié à ces maitres de la data! Vous allez voir que les termes décrivent des métiers biens définis mais les rôles associés et les besoins réels en entreprise sont tout autres.
Les Data engineer : architectes de la donnée
En tant que Data Scientist chez Dazz Studio, je travaille souvent en étroite collaboration avec des Data Engineers. Leur rôle est primordial dans la chaîne de traitement des données. En effet, le Data Engineer est un expert de la gestion des bases de données. Il est responsable de l'architecture, de la conception, de la mise en place et de la maintenance des systèmes de gestion de données.
Ses missions
Les missions du Data Engineer sont nombreuses. Je dirais qu'il constitue la premier maillon de la chaine de données. Tout d'abord, il doit collecter, stocker et traiter des données à grande échelle. Il s'occupe ensuite de leur traitement, d'un point de vue assemblage et de leur mise à disposition pour les Data Analysts et les Data Scientists. Le Data Engineer a également pour mission de veiller à la sécurité et à la qualité des données stockées. Il doit ainsi assurer la cohérence, l'intégrité et la disponibilité des données tout au long de leur cycle de vie.
Ses outils
Pour accomplir ses missions, le Data Engineer utilise divers outils liés à la data tels que des outils de gestion de bases de données (SQL, NoSQL), des outils de gestion de flux de données (Apache Kafka, Apache NiFi), des outils de stockage de données (Hadoop, Amazon S3), des outils de traitement de données en temps réel (Apache Storm, Apache Flink), ainsi que des outils de virtualisation (Docker, Kubernetes).
Cet ingénieur de la donnée maitrise donc à merveille la programmation, les bases de données, les systèmes d'exploitation, les architectures distribuées et le cloud computing. Rien que ça!
Les Data Analyst : experts en communication
Si vous êtes à la recherche d'un professionnel de la data capable d'analyser des données brutes pour en extraire des insights pertinents, alors le Data Analyst est le profil qu'il vous faut.
Les missions du Data analyst
Les missions du Data Analyst sont variées. Tout d'abord, il doit collecter des données brutes et les nettoyer pour s'assurer de leur qualité. Il effectue ensuite des analyses statistiques pour détecter des tendances et des corrélations. Il crée également des tableaux de bord et des rapports pour présenter les résultats de ses analyses. Enfin, le Data Analyst doit s'assurer que les données sont exploitables et faciles à comprendre pour les autres membres de l'entreprise.
Les outils du Data analyst
Pour accomplir ses missions, le Data Analyst utilise divers outils de la data tels que des outils de visualisation de données (Tableau, Power BI), parfois des logiciels d'analyse de données (R, Python) ainsi que des outils de traitement de texte et de feuilles de calcul.
Si vous cherchez un professionnel de la data passionné par l'analyse de données et doté d'un esprit curieux et critique, alors le Data Analyst est le candidat qu'il vous faut. Avec des compétences en analyses statistiques et une bonne connaissance des outils de la data visualisation, il est capable de transformer des données brutes en informations exploitables pour l'entreprise. Et si vous êtes chanceux, vous pourriez même recruter un Data Analyst avec un bon sens de l'humour!
Les Data Scientist : diseuses de bonne aventure
La légende raconte que le Data Scientist est le profil qui peut faire la différence pour une entreprise. Il s'agit d'un professionnel de la data doté de compétences en statistiques, en programmation et en analyse de données. Il travaille en collaboration avec l'ensemble des membres de l'équipe data pour exploiter le grand volume de données de l'entreprise.
Dans l'environnement Big Data, le Data Scientist sait à peu près tout faire mais il est surtout responsable de la création de modèles de machine learning ou d'Intelligence Artificielle (IA... Bon ok je n'avais peut être pas besoin de le préciser) et de la mise en place d'algorithmes de prédiction afin d'améliorer la performance de l'entreprise. Il utilise des techniques avancées d'analyse de données pour comprendre les données et en extraire des informations exploitables. Il est également en charge de la modélisation des données et de la création de tableaux de bord pour communiquer les résultats de ses analyses.
Les missions du Data scientist
Les missions du Data Scientist sont variées. Il doit tout d'abord comprendre les besoins de l'entreprise pour définir les objectifs de ses analyses. Si l'entreprise ne dispose pas d'une équipe dédiée, il collecte les données nécessaires et les nettoie pour s'assurer de leur qualité. Il effectue ensuite des analyses exploratoires pour comprendre les données et trouver des pistes d'analyse. Enfin, il utilise des techniques avancées (ou pas) de modélisation pour créer des modèles d'IA afin, dans la plupart des cas, d'effectuer des prédictions diverses. Ces prédictions vont de l'estimation des cours du marché, de la suggestion de musique selon vos habitudes d'écoute ou encore de la traduction de textes.
Les outils du Data scientist
Pour accomplir ses missions, le Data Scientist utilise divers outils de la data tels que des "logiciels" d'analyse orientés machine learning (R, Python), des outils orientés IA (TensorFlow, Keras), des outils de visualisation de données (R, Python), ainsi que des outils de gestion de base de données (SQL, NoSQL). Il est généralement attendu que le Data Scientist soit à l'aise avec ces outils pour mener à bien ses projets.
Les besoins réels en entreprise
Bon, maintenant que vous savez ce qui différencie ces trois métiers de la data, parlons un peu plus de la réalité du terrain. Dans le monde parfait de la Big Data, il faudrait que chaque entreprise, pour exploiter la donnée et donc être compétitive, possède une équipe complète liée à la data, comprenant des Data Engineer, des Data Analyst et des Data Scientist. Soyons honnête, il est inenvisageable pour des TPE/PME, et même certaines sociétés un peu plus grandes encore, d'avoir une équipe aussi complète car cela coute cher tout simplement. Elles ne vont, dans la plupart des cas, pouvoir créer qu'un seul poste dédier à la data science.
Ces entreprises vont alors passer par ce que j'appelle les 3 cercles de l'Enfer du recrutement en data science :
- Cercle 1 : la trichotillomanie. Dans un premier temps, les personnes responsables de la mise en place de la cellule data vont s'arracher les cheveux en essayant de trouver quel profil métier est le plus adapté à leur problématique data. "Bon faut construire la base de données, donc on va recruter un Data Engineer! .... Ah ouais mais ça pourrait être pas mal qu'après il/elle exploite la donnée pour nous montrer des tendances etc... C'est peut être un Data Analyst qu'il nous faut alors ?!". Ensemble de questions qui ne possèdent malheureusement pas de réelle réponse unique.
- Cercle 2 : le mouton à cinq pattes. Dans un second temps, ses besoins en ce qui concerne la data étant large, l'entreprise va essayer de trouver une personne sachant tout faire et maitrisant chacune des composantes de la science des données. A titre d'exemple personnel, j'ai souvent été confronté à ces attentes lorsque je cherchais à me faire recruter. De nombreuses offres de postes pour Data Scientists demandaient logiquement de maitriser tous les outils associés au machine learning, mais auxquels devaient se rajouter 3 à 5 ans d'expérience en gestion de base de données et/ou une maitrise parfaite de logiciels de data visualisation tels que Power BI. Comme vous vous en douter, il m'était impossible de cocher toutes ces cases. Peu importe l'expert de la data que vous rencontrerez, il est impossible de tout maitriser en data. En effet, comme vous avez pu le lire jusque la, chaque métier possède déjà de nombreuses spécificités méthodologiques et techniques. Ce qui nous amène au cercle suivant.
- Cercle 3 : l'abandon. Après un investissement en temps et donc en argent au recrutement pour un poste data et à force d'erreurs de recrutement, de candidats inadaptés ou tout simplement de l'absence même de candidats, certaines entreprises vont finir par abandonner/retarder la mise en place de leur cellule data ou encore pire se retrouver avec un service data incomplet et donc non compétitif.
Et c'est pour éviter ces déconvenues que nous avons créé Dazz Studio.
Avec Dazz Studio : plus besoin de se prendre la tête!
Au sein de Dazz Studio nous disposons d'un large panel de compétences liées à la tech au sens large : graphistes, dev web et même experts comptables! (Faut bien s'occuper des demandes de financements non ?). Mais nous disposons également de l'ensemble des profils associés à la data vus précédemment. "Et alors ?" me direz vous. Et bien chez Dazz Studio vous nous sollicitez pour un service, pour un projet et non pas pour un profil précis, c'est nous qui mettons à disposition les profils et les compétences nécessaires afin de satisfaire aux mieux vos attentes!
Contactez-nous pour en savoir plus sur nos services et comment nous pouvons vous aider à atteindre tous vos objectifs en ligne.