Ne dites pas à ma mère que je fais de la Recherche Opérationnelle elle me croit Data Scientist

Par Benoit Rottembourg, Data Scientist et Business Angel

03/10/2017

7 minutes de lecture

Il y a 6 mois de cela, en écrivant ce petit papier, «Le Machine Learning est-il en train d’ubériser la Recherche Opérationnelle?», je m’attendais franchement à me faire lyncher. Loin de là: j’ai reçu des dizaines de messages mêlant inquiétude, fierté et parfois même déni, de la part de mes co-religionnaires. Merci à vous tous, le débat vaut vraiment le coup d’être abordé face à ce raz de marée médiatique du Machine Learning.

Au risque de passer pour un traître à la cause de la Recherche Opérationnelle, j’ai depuis fui ma patrie algébrique. Je n’ai pas pris le premier drakkar venu, j’ai embarqué sur le Mette Maersk, là, sur la photo – c’est juste gigantesque – pour mieux me rendre compte d’où soufflait le vent. J’ai quitté une entreprise dont le slogan était «Operational Research» pour rejoindre l’équipe de «Data Science» du Groupe Maersk, à 500 mètres de la petite sirène de Copenhague. Mon transfert a représenté presque le même montant kilométrique que celui de Neymar, entre Barcelone et Paris, mais on en a moins parlé. Sur ma feuille de paye il y a désormais écrit «Data Scientist» et ce n’est pas un hasard. C’est un choix. Aussi, j’aimerais profiter de ce changement de club pour décrire en quoi le nouveau paradigme de la Data Science m’apparaît porteur pour la place de la Recherche Opérationnelle dans l’industrie.

J’ai rencontré les patrons d’une bonne trentaine d’équipes de RO et de Data Science dans ma vie professionnelle, ce n’est donc pas un échantillon représentatif, mais voilà ce qui change quand on est une équipe de Data Science (DS) en 2017:

L’accès à la donnée: Toutes les nuits, la plupart des systèmes d’information de l’entreprise, (dits Legacy Systems) poussent la data brute collectée dans la journée dans les plateformes «Big Data» de l’équipe de DS. En gros, les systèmes financiers, commerciaux, RH et de production se font une saignée de donnée quotidienne. Ceci est organisé de manière systématique et les incidents de livraison ou de qualité sont reportés et analysés. Ainsi, lorsque vous, data scientist, avez à répondre à une nouvelle question d’un décideur d’une fonction de l’entreprise, vous pouvez parfois dialoguer en quelques minutes, sur un fond de data à la fois fiable et frais. A traiter bien entendu. Cet accès plus fluide, orchestré et rapide à la data est un déclencheur de projets et accroît la qualité de service analytique.
La capitalisation du traitement de la donnée: Comme chacun sait, en forecast ou en optimisation, 70% du temps est perdu en traitement de la donnée. Et je suis charitable pour ne pas dévaloriser le travail de mes petits camarades. Par exemple, dans le dédoublonnement de la base clients, en BtoC, ou en géocodage client, en Supply Chain. Une équipe de DS bien organisée a donc en général mis en place des mécanismes de versionning, de décoration et de partage des traitements de données (on parlait d’ETL autrefois, mais cela va plus loin). Un nouveau projet, dont une part des données a déjà été traitée dans d’autres projets, bénéficie donc d’une base de démarrage plus saine, et crée à son tour des traitements qui s’ajoutent au patrimoine data de l’entreprise. C’est une forge à projets. Que l’on ne se méprenne pas sur mes propos, le véritable patrimoine est dans la tête des gars qui ont fait ces traitements. Ils sont le pivot entre la donnée et sa signification métier et boostent les projets dans lesquels ils sont impliqués.
Le prototypage façon «Minimum Viable Product» des applications centrées sur la donnée: Une fois l’accès et le traitement de la donnée réalisés, une des clefs du développement d’applications analytiques repose sur la mise à disposition «en temps réel» (le temps de la décision, par exemple s’il s’agit d’accorder un discount à un client) de nos analyses. Disposer d’une plateforme de distribution/visualisation de la donnée (via le Web), sécurisable (un client d’une fonction de l’entreprise peut voir son accès restreint à son périmètre de responsabilité) et rafraîchie, permet dès les premières heures d’un projet de fournir des vues, des analyses, et des premières recommandations. Ce produit vaut parfois application, et le rafraîchissement de toute la chaîne de traitement et d’analyse, quand la donnée brute est mise à jour, se fait sans intervention humaine, le décideur peut continuer à se servir de l’outil dans son coin, dans son métier. Ceci légitime le rôle du data scientist et crée un début d’addiction que nous connaissons tous, propice à l’adoption des outils d’aide à la décision. C’est un cycle vertueux qui a été gâché dans beaucoup d’entreprises par des outils de business intelligence arthritiques.
La confrontation des cultures: Si je suis très schématique je dirais qu’une équipe de data scientists se compose de 5 catégories de travailleurs de la donnée. Les Data Architects, les Prédicteurs, les Optimiseurs, les Business Analysts et les Data Engineers. Chaque «race» de travailleur a évidemment des tropismes, ses petites manies voire ses phobies. Le data architect déteste les petits bricolages manuels et les fichiers d’entrée .csv qui traînent, il veut faire propre et scalable. Le prédicteur voit des patterns partout (savoir que les Abdelkrim remboursent mieux que les Christelle est un plaisir intellectuel sans nom, mais s’il y a moins de 0,02% d’Abdelkrim dans la base, c’est juste sans impact) et concentre son énergie à produire des forecasts justes à 2% tout le long de l’année alors que seul le mois d’Avril a un sens pour l’usine qui sature. L’optimiseur, lui, cliveur d’espace, présuppose que les forecasts sont parfaits et que le décideur est rationnel et démarre bille en tête son programme linéaire en nombres entiers … chimérique. Le Business Analyst trouve que tout cela prend beaucoup trop de temps et si on le laissait faire fournirait des résultats moyennés, sans aucune signification, pour livrer au plus vite des courbes sexy au métier. Le data engineer est sans doute le plus pragmatique de tous, mais s’avère tout de même plutôt allergique aux changements d’interfaces, surtout quand ils sont de dernière minute, juste avant la démo au DAF. Au delà de l’humour, disposer de tous ces profils dans une même équipe, en un même lieu, évite que l’un ou l’autre de nos penchants coupables vienne nuire à la bonne marche des projets.
L’hybridation des cultures scientifiques: car dans data science, il y a science et ça ne s’oublie pas. Etre scientifique quand on fait un prédicteur pour un industriel, ça veut dire prendre du recul sur ses résultats, définir un protocole de travail (est-ce que les données qui ont entraîné mon modèle sont représentatives des données futures que je donnerai à mon application, finement représentatives) et parfois dire non, dire que les données ne méritent pas de cautionner telle ou telle décision ou qu’elles risquent fort de reproduire un biais. Etre scientifique c’est aussi appliquer le rasoir d’Ockham et proposer le modèle explicatif le plus simple possible quand la volumétrie des données ne justifie pas un modèle plus complexe. C’est aussi apporter un regard aiguisé sur les fournisseurs de logiciels (gonflés aux hormones du capital risque) qui viennent frapper à la porte. Un regard critique et d’autant plus agnostique que les cultures se sont brassées dans l’équipe. Beaucoup d’éditeurs de logiciels sont, par construction, mono-culturels au gré des vagues de buzz. L’hybridation passe également par l’enrichissement des problématiques, et quand on sait exactement de quoi les forecasts sont faits (désolé …), en tant qu’Optimiseur, on enrichit son problème et on se retrouve vite avec des flots à coûts quadratiques de 400 millions de variables. Que le Business Analyst suggère d’agréger …
Enfin, la Data Science, agent de la transformation digitale: à une époque où l’on mélange un peu tout, rien ne dit en effet que la Data Science soit indispensable à la transformation digitale des entreprises. De bons vieux algorithmes pourraient peut-être faire l’affaire. Rien ne dit non plus que des robots malveillants et conscients d’eux-mêmes dévoreront les neurones de nos enfants, enfin ceux qui restent après les jeux vidéos. Toutefois, ce qui change, et c’est le facteur de renouveau le plus significatif que je perçoive, c’est la place accordée aux mathématiques dans la transformation de l’entreprise. En 28 ans de Recherche Opérationnelle, j’en ai transformé des processus, mais soyons francs, la Recherche Opérationnelle, dans la 50aine d’entreprises pour lesquelles j’ai travaillé, n’était pas le bras armé de la transformation. On optimise souvent à iso-process, au sein d’un même silo de l’entreprise. On prend le process courant comme une contrainte et on cherche la bague sous le lampadaire. C’est pour partie lié au formalisme «plat» de la fonction objectif, des variables de décisions et des contraintes, mais la RO porte souvent son effort sur la minimisation des coûts des opérations dans un cadre pré-existant. La Data Science, dans la perception qu’en ont les directions générales, embrasse un espace de changement plus large, est vécue comme un accélérateur de mutation et se propose de modifier également la relation de l’entreprise à ses fournisseurs et ses clients. Elle produit des agents relationnels et transactionnels et casse les dogmes. Est-ce lui accorder trop de crédit, l’avenir nous le dira, mais elle fait reposer sur les épaules des scientifiques de la donnée une ambition plus large que celle qui était confiée aux traditionnels chercheurs opérationnels. C’est en tous cas ce que je ressens. Ceci entraîne une visibilité plus grande, un alignement avec la stratégie de l’entreprise plus couplé et des attentes plus fortes.

Ecrire 3 pages sur la Data Science sans citer Deep Learning et Intelligence Artificielle est assurément une performance de haut vol, à moins que ce ne soit le signe d’un début d’humilité scandinave. Néanmoins, j’ai moi aussi mes métaphores foireuses. Tous ces petits capteurs qui se multiplient sur la peau des entreprises (sur le web, dans le centre d’appel, auprès des équipements, dans les équipements, autour des flux, auprès des salariés) constituent un semis de points qui dessinent une forme, une forme en mouvement qu’est l’entreprise. Une forme de plus en plus précise, vraisemblable, malléable à l’effort. Un peu comme le «motion capture» de la photo de couverture, ces petits capteurs permettent ensuite au Data Scientist, adossé aux hommes de l’art, de reproduire les mouvements de l’entreprise, pour mieux les synthétiser puis les extrapoler. Ce modèle de l’entreprise est plus qu’un outil d’aide à la décision, certes il permet de savoir quand acheter un nouvel équipement et où le placer, quel client flatter ou punir, mais ce n’est pas qu’un exosquelette pour décideur paresseux. L’exosquelette absorbe les choix du décideur, le soutient dans l’effort, l’imite dans sa démarche et en vient à le modifier de l’intérieur. Ce n’est plus de l’aide à la décision, c’est autre chose.

L’expert:

Benoit Rottembourg met de l’huile mathématique dans les moteurs de pricing du groupe Maersk, le leader mondial du transport de containers.

A la fois Data Scientist et Business Angel de jeunes pousses technologiques, il s’acharne à décrypter les recettes (qui marchent) et les fantasmes (qui enflent) autour de la transformation digitale par les Data Sciences.

À propos
Articles récents

Les Experts

Olivier Ezratty, Rodrigo Sepulveda, Gregory Renard, Laurence Faguer, retrouvez les analyses de nos experts dans les deeptech, investissement, IA, retail, santé...

Pour contacter la rédaction: redaction@fw.media

Vous souhaitez contribuer régulièrement en tant qu'expert sur FRENCHWEB.FR, merci de nous contacter à redaction@fw.media

Les derniers articles par Les Experts (tout voir)

03/10/2017

7 minutes de lecture

4 commentaires

Serge dit :

03/10/2017 à 21h40

Pour un témoignage d’expert, cet article est quand même noyé par les clichés et les buzzwords. Quel est l’intérêt d’opposer Recherche Opérationnelle et Datascience ? Pour quelle raison la première catégorie n’aurait pas des SI efficients ? Jetez un œil aux startups et PME, vous y trouverez des datascientists qui sont polyvalents et qui font même de la RO ;-)
Phil dit :

05/10/2017 à 11h10

C’est tout de même dommage qu’il y ait une faute d’orthographe dès le titre :
le circonflexe sur le i de « dîtes » ne s’emploie qu’au subjonctif ! Donc surtout pas à l’indicatif et encore moins à l’impératif !
C’est bizarre que cette erreur soit si fréquente, au point qu’on la trouve même dans les publicités !
Ici elle nous saute aux yeux dès le 2ème mot du titre…
Ceci étant dit, sur le fond, j’ai trouvé l’article intéressant notamment parce qu’il s’appuie sur une expérience personnelle de son auteur.
1. Benoit dit :
  
  01/02/2018 à 14h00
  
  Merci Phil (est-ce l’orthographe correcte de votre nom?)
  
  J’aurais bien voulu donner comme excuse le fait que j’écris avec un clavier danois (øøøæææææååååååå), ce qui est vrai, mais non, ce n’est pas le cas. C’est une vraie faute. Mea culpa.
  1. Carolina Tomaz dit :
    
    01/02/2018 à 14h10
    
    C’est corrigé ^^

L’expert:

[FW Radar] Impala, la data science et l'intelligence artificielle au service de l'orientation scolaire

Quelle est la stratégie d'innovation du Arkéa ?

4 commentaires