Data Scientist, une nouvelle voie

Curieux de nature, je me suis naturellement orienté vers les sciences pour chercher les réponses à mes questionnements sur le fonctionnement du monde. Ce parcours m’a apporté certaines réponses et exacerbé mon envie d’apprendre, mais je dois reconnaître que face à la découverte du monde quantique et du gigantisme du Cosmos, je ne peux, en tant qu’être humain, que me sentir humble et développer mon esprit critique au regard de ma capacité à percevoir, appréhender et comprendre la nature et le fonctionnement de l’Univers. Je me suis imprégné de la méthode scientifique par l’expérimentation, la collecte et l’analyse des données en me spécialisant dans les sciences physiques et la chimie. Ces données représentent une fenêtre sur le monde que les scientifiques cherchent à comprendre.

Tout en aiguisant mon esprit d’analyse, j’ai pu m’apercevoir que je m’épanouissais davantage dans un environnement évolutif, au croisement de multiples disciplines, dans lequel ma curiosité est constamment stimulée. J’ai besoin d’un métier polyvalent qui me permet de continuer à m’enrichir au contact d’experts de disciplines variées comme la science, la santé, l’énergie ou la finance, par exemple, et de contribuer à solutionner leurs problématiques grâce à mon esprit d’analyse et mes compétences relationnelles.

Bien plus coopératif que compétitif, j’aime partager et vulgariser mes connaissances autant qu’apprendre et découvrir de nouveaux points de vue. En général, les personnes que je rencontre apprécient échanger avec moi, notamment grâce aux analogies que j’essaie de trouver dans leurs propres domaines d’expertise.

Empathique, rigoureux, autonome et créatif, mes collègues de travail et mes proches, apprécient mon écoute, ma persévérance et mon pragmatisme à définir et hiérarchiser avec clarté leurs possibilités et leurs besoins en fonction de leurs questionnements. Bien souvent, je prends rapidement à cœur ces problématiques, quitte à développer mes propres compétences pour affiner mes analyses dans le but de faciliter leur prise de décision.

En outre, passionné d’informatique et motivé par les qualités inhérentes à la data science, c’est tout naturellement que je suis attiré par le métier de Data Scientist.

Data Science, ses enjeux

L’essor du Big Data de cette dernière décennie a propulsé la data science de façon fulgurante au premier plan dans tous les secteurs d’activité. L’avènement des GAFAM, des réseaux sociaux, des objets connectés, des plateformes de streaming et plus généralement la numérisation de nos sociétés grâce au développement du réseau des réseaux, Internet, ont grandement facilité la collecte, l’échange et le stockage d’un volume très important de tout type de données qualifié aujourd’hui de Big Data. Pour se faire une idée plus concrète, entre seulement 2011 et 2013, le volume mondial de données récupéré a été multiplié par 9 et continue de croître rapidement. L’humanité est passée de 2 zettaoctets de données en 2010 à 64 en 2020 et le seuil des 180 devrait être atteint en 2025 (Un volume de donnée de 180 Zo est « équivalent » à un livre gigantesque de 45 milliards de milliards de pages écrites).
NB : 1 Zo = 1 milliard de téraoctets (To) = mille milliards de gigaoctets (Go) = 1 million de milliards de mégaoctets (Mo). Une photo standard prise avec votre smartphone pèse en moyenne entre 3 et 5 Mo et une page A4 écrite sur Microsoft Word pèse environs 1 000 fois moins.

La data science est un champ pluridisciplinaire, fondée sur des techniques et des théories émanant de multiples domaines et champs d’expertise, dont le but principal est d’identifier des tendances, des motifs, des points d’intérêts et des corrélations dans de larges ensembles de données. Autrement dit, il s’agit de l’extraction d’informations exploitables à partir de tout type de données brutes : des habitudes d’achats ou de consommation d’énergie de clients à l’optimisation des processus opérationnels aéronautiques, en passant par le traitement en temps réel de données instantanées que collectent les véhicules autonomes pour se déplacer.

Sa nature multidisciplinaire ouvre la science des données à un large éventail d’outils et de techniques sur lesquels s’appuyer pour résoudre les problématiques auxquelles elle fait face : la programmation, les mathématiques, les statistiques, l’algorithmique, l’analyse prédictive, le machine learning (ML), l’intelligence artificielle (IA)…

Plus qu’un domaine théorique, la data science est une discipline appliquée. Ses découvertes sur les données peuvent rendre possible la création de services ou de produits innovants, réduire les coûts opérationnels, révéler et résoudre des problèmes concrets tel que : le diagnostic précoce de maladies, le ciblage publicitaire, la détection de fraudes ou d’anomalies sur une chaîne de production… Elles permettent aussi de faciliter la prise de décision, la planification stratégique et plus globalement d’optimiser tous les processus d’une organisation, quelle que soit sa nature ou son secteur d’activité.

De nos jours, que ce soit pour valoriser les données et rester compétitif sur le marché, avancer dans la recherche ou encore faire du développement durable, l’analyse des données nécessite plus que jamais l’expertise technique que le data scientist apporte.

Data Scientist, son rôle

Dans Matrix, Néo est capable de lire la Matrice. Dans notre monde, le data scientist dispose (presque) des mêmes capacités. Il est le spécialiste capable de déchiffrer les Big Data, ces masses d’informations générées quand nous likons une image de chat sur Facebook ou quand nous allumons la lumière dans notre maison reliée à un compteur Linky. Dès que nous utilisons un outil connecté, nous nourrissons quelque part dans le monde les travaux d’un data scientist.

« Sa mission consiste à puiser dans ces données des informations qui permettent d’éclairer la connaissance, quel que soit le domaine » (Gaël Varoquaux, data scientist à l’Institut national de la recherche en informatique et automatique (Inria)). Autrement dit, il s’appuie sur ses compétences en mathématique, statistique et informatique pour gérer les données et en extraire les tendances dans le but de leur donner un sens pour les valoriser et faire des prédictions.

Plus concrètement, dans le secteur privé, il cherche à rendre les données exploitables afin d’aider l’entreprise à orienter sa stratégie de la manière la plus efficace possible. Il contribue à créer de nouveaux services et à améliorer ceux déjà en place. Pour ce faire, il doit également comprendre les objectifs stratégiques de la structure pour laquelle il travaille.
Il peut aussi être amené à remettre en question des hypothèses existantes pour trouver des solutions à certains défis que rencontrent les entreprises, à stocker l’information, à effectuer de la veille ou encore à collecter lui-même les données. Ses missions varient énormément selon la taille et l’organisation de la structure pour laquelle il travaille.

Une fois les objectifs du problème à résoudre clairement définis et les données collectées, nettoyées et analysées, ce spécialiste de la data met en place des algorithmes pour créer des modèles qui l’aident à mieux tirer profit de ces données.

Par ailleurs, constamment au contact d’experts de multiples disciplines, il a aussi un rôle d’intermédiaire et cherche à communiquer ses découvertes, ainsi qu’à rendre accessible les outils qu’il développe et met en place, à un large auditoire afin de mener ses projets à bien.

En résumer, un data scientist cherche à découvrir et extraire de la valeur à partir des données qu’il a disposition dans le but d’apporter une solution accessible, à communiquer ou à mettre en place, au problème métier de son client ou de son employeur.