Tous secteurs confondus la quantité de données produites est désormais vertigineuse. Ainsi, à titre d’exemple, dans l’industrie automobile la plupart des dernières voitures lancées sur le marché produisent assez de données pour remplir un smartphone en quelques semaines. Il en va de même pour l’ensemble des secteurs économiques car qu’il s’agisse du retail, des services financiers, ou encore du marketing, tous ont perçu le potentiel des données et les bénéfices à en tirer.
Le rôle essentiel des ingénieurs de données
Cette prise de conscience a entrainé la mise en place d’une nouvelle catégorie d’employés au sein des entreprises : les professionnels de la donnée. Il faut cependant faire la distinction entre les différents intervenants sur la donnée, que ce soient par exemple les data scientists ou les data engineers. Car si les premiers sont particulièrement bien reconnus et identifiés sur le marché, quid des ingénieurs de la donnée ?
Ce sont ces derniers qui préparent la data, la normalisent et la « nettoient » pour la rendre exploitable pour pouvoir en faire des extractions et des analyses. Préparer les données pour en tirer de bons enseignements est donc une étape incontournable et il y a fort à parier que, d’ici quelques années, la qualité des données sera encore plus bénéfique. Utiliser la data comme outil d’aide à la décision se fera massivement à tous les niveaux et pour tout type d’entreprises. Le besoin en ingénieurs de la donnée est donc en constante augmentation et il semblerait que le marché soit confronté à un problème récurrent de recrutement mais également de rétention de ceux déjà en poste.
Manque de formation et accélération de la transformation
Les raisons de ce manque en ingénieurs de la donnée sont avant tout contextuelles car, il y a encore 3 ans, la data n’occupait pas une telle place au sein des entreprises et les primo-arrivants sur le marché de l’emploi, fraichement diplômés, n’ont pas reçu de formation spécifique pour faire face à ce traitement massif des données, qui nécessite de maîtriser de nouvelles solutions et de nouveaux langages, notamment dans le cloud. Mais aujourd’hui la quantité de données générée est telle que les compétences nécessaires pour assurer cette fonction ont largement dépassé le niveau des fonctions de back office où elles étaient jusque-là cantonnées. Elles concernent aujourd’hui l’ensemble des « métiers » en entreprise qui veulent tous « consommer » de la donnée.
Si des changements dans le système éducatif sont en train de s’opérer pour pallier ce manque, notamment dans les filières post-bac, il n’est pas le seul à blâmer pour comprendre cette pénurie. Il semblerait que tout le monde ait été pris de court par la vitesse d’évolution de la technologie, qu’il s’agisse de vitesse de connexion aux ordinateurs, ou de déploiement de fibre optique, qui ont largement dépassé les limites qui étaient alors envisagées. Cette vitesse permettant, entre autres, une meilleure compression, elle a entrainé une forte accélération de la production de données et de ce fait a pris de court nos capacités d’analyse. A cela s’ajoute le déploiement des objets connectés, et l’accès à de plus en plus de bases de données, que ce soit via les initiatives d’open data, ou via les échanges de plus en plus fréquents entre partenaires business. Autant de phénomènes qui entraînent la multiplication des sources de données et la nécessité de les traiter pour pouvoir les exploiter.
C’est donc la vitesse d’évolution plutôt qu’un manque d’anticipation qui aurait abouti à la situation actuelle.
Vision d’ensemble et appétence pour les corrélations, les deux compétences clés du data engineer
Le besoin en ingénieurs de la donnée est donc réel mais il faut également savoir identifier les bons profils qui non seulement auront les connaissances techniques, mais sauront aussi comprendre les enjeux commerciaux de la donnée. Cette fonction requiert des aptitudes spécifiques telles que la capacité à avoir une vue d’ensemble des activités de l’entreprise. En effet, lorsqu’un ingénieur de la donnée se penche sur celle-ci, il ne la traite pas pour un usage unique mais plusieurs ; il doit donc être capable d’avoir une vision d’ensemble, pour savoir où ses données peuvent être appliquées et comment en optimiser l’usage. Il doit également questionner l’origine de la donnée, sa fiabilité, ainsi que sa capacité à être interprétée de plusieurs manières. Enfin, comment préserver l’utilisateur d’une erreur d’interprétation de la donnée fournie ? Autant de questions essentielles à la préparation de la donnée pour lui donner une vraie valeur.
Autre aspect non négligeable de la fonction en lien avec la capacité à prendre de la hauteur ; un bon ingénieur de la donnée doit être parfaitement au fait du travail du data scientist c’est-à-dire comprendre les missions de ce dernier pour lui préparer les données à analyser les plus « propres » possibles. Enfin, il doit combiner curiosité et « Data Literacy » (ou datalphabétisation en français), c’est-à-dire la capacité à lire, analyser, travailler et argumenter tout en ayant recours aux données pour la prise de décision. Sans cette tournure d’esprit spécifique, son parcours professionnel au sein de la donnée risque de tourner court.
Comment recruter les data engineers puis les retenir en entreprise
Dans le cadre d’un recrutement, il faut également apporter un soin particulier à la typologie des postes proposés et à la façon dont ils sont qualifiés. En effet, l’absence de normalisation en termes de dénomination des rôles peut parfois prêter à confusion. Certaines entreprises vont qualifier les ingénieurs en informatique de scientifiques des données et inversement ailleurs. Il y a donc un réel besoin d’uniformiser, de classifier et de préciser le rôle de l’ingénieur de la donnée. Une partie de la réponse passe par la formation pour normaliser et certifier les rôles entre les ingénieurs et les scientifiques ; cela permettrait de mettre fin aux confusions récurrentes. En effet, dans certains pays, une qualification spécifique est requise pour devenir ingénieur ; tandis qu’au Canada, par exemple, il faut être titulaire d’un diplôme en ingénierie pour exercer ce type de fonctions alors qu’ailleurs de nombreux développeurs sont plutôt titulaires d’un diplôme en informatique.
Quoi qu’il en soit, la profession a le vent en poupe ; ainsi, selon une étude réalisée par l’EBG (Electronic Business Group) et Stratégies les profils data sont les plus plébiscités à 84% par les dirigeants interrogés sur le sujet. Mais une fois les bons recrutements effectués, il faut savoir mettre en place une dynamique pour stimuler et retenir ces ingénieurs. Cela peut se faire en bonne intelligence avec des dispositifs qui ont déjà fait leur preuve en termes de renforcement de l’implication et de l’engagement des collaborateurs : lancer des défis constants, donner les moyens nécessaires à l’accomplissement des tâches et valoriser les personnes. Il faut également être en mesure de leur proposer un salaire attractif car la conséquence directe de cette course au bon profil est une forte hausse des salaires obtenus par les data scientists, les data miners ou autres responsables BI, et architectes data en 2019 (+12,8%). Enfin, dernier critère essentiel d’attractivité, les outils qui seront mis à leur disposition feront également la différence. Ainsi, les solutions de Data Integration évoluent pour faciliter leurs tâches et proposer des processus qui répondent au besoin de traitement en temps réel des données.
Si les professionnels de la donnée sont donc en première ligne pour savoir « la faire parler » et en tirer la substantifique moelle, ils ne devraient pas être les seuls à devoir supporter cette avalanche de données. En effet, l’ensemble des employés en entreprises devrait être « datalphabétisés » et s’impliquer dans une réelle approche de la donnée mais c’est encore loin d’être le cas. Ainsi selon une étude réalisée par la Wharton School et le cabinet d’études IHS Markit, si les deux tiers des entreprises (63%) ont l’intention d’embaucher davantage de salariés compétents en matière de données, la responsabilité de ces compétences repose sur ces derniers. Les dirigeants d’entreprise se montrent encore trop peu disposés à engager des ressources en faveur de l’amélioration de la datalphabétisation de leurs salariés. Cependant la maîtrise de la lecture des données devrait faire partie du quotidien de chacun car tout le monde est amené à faire usage de la donnée à divers niveaux dans l’exercice de son travail.