“Mon métier de Data Scientist” – Etienne Candelot

Aujourd’hui marque le dernier jour de notre semaine interne des développeurs chez Retail Shake. On vous propose de découvrir avec Etienne, futur doctorant de l’équipe et actuellement en CDD, sa profession de Data Scientist, élue métier le plus sexy du XXIe siècle par la Harvard Business Review. 

Qu’est-ce qu’un Data Scientist ? 

Un Data Scientist est un scientifique des données. Expert en analyse de données, avec très souvent des compétences managériales et marketing, le ou la Data Scientist récolte, organise et analyse des données croisées afin d’identifier des tendances, faire des prédictions et proposer des solutions qui profitent à l’entreprise. 

Quelles sont les missions d’un Data Scientist ? 

Les missions d’un Data Scientist s’articulent souvent autour d’une problématique de recherche. Il s’appuie alors sur le traitement de données, des statistiques et l’aspect prédictif de l’IA ( Intelligence Artificielle) pour répondre à cette problématique.  

C’est un travail à quatre (4) axes :

  • Comprendre les problématiques de l’entreprise liées à la Big Data
  • Trouver une modélisation statistique qui répondrait à la problématique
  • Faire de la veille technologique et bibliographique pour détecter les données existantes et pertinentes pour le projet 
  • Expérimenter, prototyper et restituer les résultats

Comment devenir Data Scientist ? 

Pour briguer une place de Data Scientist, il faut cocher certains pré-requis.

Le Data Scientist est confronté à des flux massifs de données, il doit donc aimer les chiffres et les masses d’informations.  Il doit également être à l’aise avec les outils d’analyse, la programmation et avoir de bonnes capacités analytiques. 

Sur le plan personnel, il doit être passionné et faire preuve de curiosité intellectuelle, car il s’agit d’un travail de constante recherches et de veilles. Il doit savoir travailler en autonomie tout en ayant un grand sens de la communication. 

Et toi, Etienne, quelles sont concrètement tes missions chez Retail Shake ?

“J’ai fait des études d’ingénieur en informatique, spécialisé dans la data science. Au cours de ce cursus, j’ai développé une affection particulière pour la vision par ordinateur. Dans le cadre de ma thèse de doctorat, je mène un projet en rapport avec cette thématique chez Retail Shake. Les résultats que nous obtiendrons de cette démarche seront appliqués aux millions de produits scrappés quotidiennement par l’application Retail Shake et rendra encore plus intuitif et simple la veille concurrentielle pour nos clients. ”  

“ Et concrètement, mes journées de travail sont souvent dédiées à de la veille technologique, avec un travail bibliographique permettant d’établir l’état de l’art dans le domaine d’étude. Je réalise des travaux techniques d’expérimentation et de prototypages autour de l’entraînement d’algorithmes d’intelligence artificielle. Sinon, je travaille sur des projets parallèles liés à ma formation de data scientist en fonction des besoins de l’équipe. Par exemple, je travaille actuellement sur un projet d’amélioration du moteur de recherche de notre application.”

Interview – Qu’est-ce que le scraping

 Aujourd’hui c’est la journée mondiale des développeurs. Nous sommes donc allés à la rencontre d’un de nos collaborateurs tech, Mousse Sambou. Mousse, Data analyst chez Retail Shake a accepté de nous parler de son travail passionnant et de répondre à nos questions sur le scraping et son importance pour notre activité.

Mousse Sambou, interview Scraping
Mousse Sambou, Data Analyst chez Retail Shake

« Bonjour ! Peux-tu te présenter et nous raconter ce que tu fais au sein de l’entreprise Retail Shake ? »

Bonjour !  Je m’appelle Mousse Sambou et je suis Data Analyst chez Retail Shake où je suis chargé du scraping web et du monitoring de la data. 

« Tu es chargé du scraping web entre autres. Peux-tu nous en dire un peu plus sur cette mission ? Qu’est-ce que le scraping de données par exemple ? »

“Scraping” est un mot anglais qui signifie littéralement “gratter” en français. Et, quand on parle de scraping dans notre domaine, c’est l’action d’automatiser l’extraction des données d’un site web. 

« Et comment marche cette automatisation de l’extraction des données ? »

On écrit des programmes (scripts) informatiques qui parcourent les informations d’un site( aussi appelées le code html) et récupèrent les données qui nous intéressent. Une fois que les scripts ont capté l’information dans le code html, ils le présentent sous une forme qui facilite la lecture et l’analyse. 

« Quel est l’intérêt d’écrire des programmes qui vont récupérer la donnée sur des sites ? Que fais-tu de la donnée une fois qu’elle a été scrappée ?  »

Cette donnée scrappée sert à alimenter notre outil de veille concurrentielle. On crée progressivement une puissante base de données qui nous permet de mettre à la disposition de nos clients, des outils de veille stratégique. 

« Quel est l’intérêt pour une entreprise de disposer de la donnée que tes robots ont récupérée sur un site concurrent ? »  

L’outil permet aux clients d’effectuer leur veille tarifaire, de géolocaliser les stocks et propose un suivi des points de vente des concurrents. Les entreprises, grâce à ces données concurrentielles centralisées et plus accessibles, peuvent prendre des décisions stratégiques. 

« Nous scrapons également des Marketplaces comme Amazon, Cdiscount, Leroy Merlin. Est-ce qu’aujourd’hui, nos robots différencient les produits proposés par le vendeur lui-même de ceux proposés par les vendeurs tiers ? »  

Oui, nous savons faire cette distinction et nous l’avons d’ailleurs déjà fait pour certains de nos clients. Actuellement, nous travaillons pour l’intégrer à notre application et la rendre accessible à tous nos clients.

« Durant toute cette interview, on a parlé de collecter les données des entreprises. On peut avoir tendance à se demander si tout ça est légal. Peux-tu donc nous dire si le scraping est bien légal ?»

« Interdire le scraping, c’est comme interdire Google »

– Mousse Sambou

Oui c’est légal et c’est même bien vu par les pouvoirs publics car cela facilite la concurrence. C’est même le principe de base des moteurs de recherche comme Google et autres qui récupèrent les informations des sites pour créer une base de données de recherche. Interdire le scraping, c’est comme interdire Google.

Nouveau bureau 😊

L’équipe Retail Shake a un peu plus d’espace et un vrai coin café. Nous sommes toujours à EuraTechnologies avec Sarah, David et Christophe.

Nouveau Bureau

Un lieu de travail hybride

Notre espace est un lieu de travail et un lieu de vie. Nous souhaitons avoir des zones d’échanges et de travail informelles. L’aménagement de notre bureau permet de créer des synergies, grâces auxquelles découlent des échanges et des idées de nouveaux projets.