Data Scientist ou le métier fantôme

C’est le métier le plus convoité par les candidats Tech. Et pourtant, c’est le moins pourvu de tous...

Depuis plusieurs mois, un nombre toujours croissant de candidats souhaitent décrocher un job en data science. Et enchainent des formations toujours plus pointues.

Malheureusement, le nombre de postes en startup ne suit absolument pas la courbe de cette demande exponentielle et 95% des candidats, même (et surtout !) ultra spécialisés, ne se feront tout simplement pas recruter.

Pourquoi ? Voici plusieurs éléments de réponses…

Distinguer Data Scientist, Data Engineer et Data Analyst

Tout d’abord, il est important de distinguer data scientist, data engineer et data analyst ! On voit beaucoup de CV de candidats qui disent avoir fait de la data science alors qu’en réalité, il s’agit plutôt de data analyse ou de data engineer.

La data science est considérée, selon le bigdata.fr, comme un mélange entre la data inférence, le développement d’algorithme et la technologie, dont l’objectif est la résolution de problèmes analytiques complexes. Au cœur de ce grand mélange, on retrouve les données, les quantités massives d’informations brutes stockées dans les data warehouses des entreprises. Concrètement, la data science permet d’utiliser les données de façon créative pour générer une valeur pour les entreprises.

Un fois que l’on sait faire la différence entre data scientist, data engineer et data analyst, il faut affronter une première déconvenue : la data science en entreprise ne ressemble pas à celle enseignée à l’école. C’est une vraie déception pour les candidats ultra motivés, et dont dont l’hyper spécialisation - NLP, ML, Deep Learning, devient, sur le terrain, une voie de garage. Les startups n’ayant aucun besoin de tels experts…

En réalité, loin du fantasme qui entoure le data scientist, sorte de saint Graal du Tech en devenir, nous ne connaissons, après des années de recrutements de profils data, d’échanges avec des entrepreneurs et d’analyses chez Ignition Program, que deux cas de figures dans lesquels une startup recrute un data scientist :

- Les startups dont le produit (software dans la plupart des cas) repose sur une data très poussée, avec parfois des besoins en ML, IA, NLP, Deep Learning etc…

- Les startups plus matures - des scale-up, qui ont déjà constitué une équipe data, ont agrégé suffisamment de données et ont aujourd’hui un réel besoin business expliquant le choix de recruter un pur data scientist.

Dans les autres startups, il est tout simplement impossible de trouver un poste pur de data science. A fortiori hyper spécialisé.

Les startups avec un produit data poussé (en ML, IA, NLP, Deep Learning etc.)

Les startups avec un produit data poussé sont très rares sur le marché. En effet, elles nécessitent énormément d’investissement au départ pour réussir à créer ce produit poussé, des mois de R&D avant de pouvoir commercialiser leur produit. Un gros risque que peu de startups sont prêtes à prendre car elles ont très peu de capitaux au début (les VCs étant de moins en moins enclin à les financer car le ROI est beaucoup plus long).


Ces quelques startups recherchent bien sûr les meilleurs profils dans leur domaine. Les places sont donc trustées par des profils seniors ou des profils sortant de grandes écoles d’ingénieur (X et Centrale-Supélec notamment).


Étant donné que le nombre de candidats souhaitant rejoindre ces projets est bien supérieur au nombre d’opportunités, les startups peuvent se permettre d’être très exigeantes sur les profils et ont très peu de problèmes de recrutement.

Les startups plus matures


Parmi les startups qui cherchent à recruter un pur data scientist, certaines, déjà matures, ont déjà un produit commercialisé qui fonctionne très bien. Elles souhaitent désormais automatiser au maximum leurs produits, ou intégrer la data science dans celui-ci, dans le but de pouvoir proposer leurs produits à un nombre exponentiel de clients sans trop d’effort humain.


En d’autres termes, elles souhaitent “scaler”. Même dans ces startups assez matures dont le core business n’est pas la data, on peut avoir besoin de profils data pour aider sur des problématiques plus générales. Reste que le métier le plus recherché sera bien focus data science.

Pour résumer : les trois malentendus autour du métier de data scientist

Pour résumer, il y a donc trois malentendus qui perpétuent l’idée que data scientist est un métier qui a le vent en poupe.

-     Premièrement, ce tout jeune métier est dopé par un méchant effet de mode. Les candidats y voient la Rolls des métiers Tech et enchainent donc des formations poussées ou pointues en école (comme data scientist en deep learning) sans se rendre compte qu’il y aura rarement un débouché à l’arrivée pour un profil aussi fin dans des startups qui privilégient la plupart du temps les candidats plus généralistes.


-      Deuxièmement, les formations spécialisées proposées par les écoles ne représentent absolument pas le métier terrain ni la réalité du besoin des startups en interne. Résultat, les candidats, mal informés, perdent du temps dans une formation qui sera obsolète dans leur CV.


-       Enfin, le métier étant encore assez mal compris, les startups elles-mêmes peuvent être persuadées de chercher un data scientist alors que ce n’est finalement pas leur besoin. Les désillusions sont fréquentes pour les personnes les rejoignant et se rendant compte, après coup, qu’ils ne sont pas sur le job promis.


Mais bonne nouvelle !

Les candidats aux profils data qui acceptent de coller à la réalité du marché ont, eux, un véritable boulevard devant eux ! Avec de bonnes connaissances data, plus généralistes, les postes à pourvoir sont nombreux et hyper intéressants ! Parce que si la data science a pour but d’automatiser au maximum les outils/les process et donc d’augmenter la rentabilité, il faut bien - avant l’intervention d’un data scientist - celle d’un architecte, le data engineer puis celle d’un data analyst pour tirer réellement profit du travail du data scientist.

Si tu as un profil data, alors tu le sais bien : pour utiliser la data, il faut commencer par l’uniformiser, avoir des BDD conséquentes et connectées entre elles. Pour cela, les startups cherchent majoritairement des candidats data plus généralistes, débrouillards et touche-à-tout : un data prêt à faire du data engineering, de la data analyse et un peu de data science si jamais le besoin s’en fait ressentir. C’est la meilleure porte d’entrée ! Si une entreprise dit chercher un data scientist comme premier poste data, demande-toi si à court terme si tes missions principales seront purement algorithmiques ou non.

Notre conseil Ignition Program pour la fin

Arriver dans une startup jeune en tant que “data généraliste” te permettra de prendre part à tous les sujets data de la boite. Et au fur et à mesure, de créer une équipe. Puis de conserver un focus à terme, si tu le souhaites, sur les problématiques plus data science, quand elles deviendront prioritaires en termes de business pour la boite. Bonne chance à toi !

Partagez cet article !