BIOTECHIN THE LOOP

Connaissez-vous BIOPTIMUS, la startup française qui veut programmer la biologie avec l’IA ?

📩 Pour nous contacter: redaction@fw.media

La biologie reste, de l’aveu même des chercheurs, le système le plus complexe que l’humanité ait tenté de comprendre. Malgré des décennies d’accumulation de données et de construction de bases de connaissances, la médecine ne dispose toujours pas d’un cadre prédictif robuste pour anticiper, de manière rationnelle, l’effet d’un traitement ou l’évolution d’une maladie. Cette « carte incomplète » du vivant se traduit par un chiffre simple, près de 90 % des médicaments qui atteignent les essais cliniques échouent, après des années de développement et des centaines de millions investis.

L’intelligence artificielle a  transformé la biologie de manière parcellaire. AlphaFold, développé par Google DeepMind et couronné par le prix Nobel de chimie 2024, a changé la donne en résolvant un problème resté ouvert pendant des décennies, en prédisant la structure tridimensionnelle des protéines à partir de leur séquence d’acides aminés. Mais si AlphaFold a révolutionné la biologie structurale, il ne couvre qu’un fragment du problème global. Comprendre le vivant implique de relier les gènes, les protéines, les cellules, les tissus, les organes, l’environnement et l’histoire médicale de chaque patient.

C’est précisément l’ambition de Bioptimus, startup parisienne qui se positionne sur un territoire à la fois scientifique et industriel et veut construire un modèle de fondation multi-échelle et multi-modal pour la biologie, un « GPT du vivant » qui génère des simulations biologiques.

De l’IA de diagnostic au modèle de fondation pour toute la biologie

En un an, l’entreprise a déjà mis sur le marché H-Optimus-0, un modèle de fondation open source pour la pathologie, présenté comme le plus grand modèle d’IA dédié à cette discipline. Indépendamment, des équipes de Harvard et de l’université de Leeds ont montré qu’il dépasse les modèles existants sur plusieurs tâches : prédiction de l’expression génique à partir de la morphologie des tissus, subtypage de cancers de l’ovaire, détection de biomarqueurs permettant de mieux estimer la réponse à certains traitements.

H-Optimus-0 a déjà été téléchargé plus de 100 000 fois, ce qui, dans un domaine aussi spécialisé que l’histopathologie, est plus que satisfaisant. Pour Bioptimus, ce modèle n’est que la première étape, la feuille de route prévoit la sortie d’un premier modèle multimodal capable de relier données génétiques et imagerie, avec des applications directes en oncologie, notamment pour la détection de mutations à l’origine de cancers et l’amélioration de la stratification des patients.

À plus long terme, l’objectif est de construire des digital twins, des jumeaux numériques de patients, intégrant leur génome, leurs données cellulaires et tissulaires, leur historique clinique et, à terme, des facteurs environnementaux et de mode de vie. Ces jumeaux numériques seraient utilisés pour simuler l’effet de traitements avant même l’administration, avec l’espoir de réduire drastiquement les échecs en clinique et de personnaliser les stratégies thérapeutiques.

Trois ressources critiques : données, compute et équipe

Pour prétendre modéliser la biologie à toutes ses échelles, Bioptimus a dû sécuriser trois actifs devenus stratégiques.

D’abord, les données, car contrairement au texte sur Internet, la quantité de données biologiques pertinentes, de bonne qualité et suffisamment profondes pour entraîner des modèles de fondation est limitée, souvent propriétaire, et rarement publique. Une partie des jeux de données s’achète au prix fort, parfois plusieurs millions pour quelques milliers de patients, dans un marché encore mal stabilisé où une base payée aujourd’hui peut ête un an plus tard, un standard ouvert ou fortement déprécié. La startup combine des données publiques, des partenariats hospitaliers et l’accès aux données patients d’Owkin, qui l’a incubée, pour alimenter ses modèles sur des cas cliniques concrets.

Autre actif nécessaire, la puissance de calcul. En un peu moins d’un an, Bioptimus a levé l’équivalent de 65 millions d’euros, dont une part significative est investie dans des clusters GPU et des infrastructures cloud dédiées. Une grande partie des capitaux levés est absorbée par l’entraînement de ces modèles massifs, capables d’intégrer plusieurs modalités et d’opérer sur des volumes de données hétérogènes.

Enfin, l’équipe. Bioptimus a réuni des profils issus de Google DeepMind, d’Owkin et de laboratoires académiques de premier plan. Sur le terrain, cela se traduit par des équipes où cohabitent spécialistes du machine learning, pathologistes, biologistes, ingénieurs HPC et data scientists, chacun avec une profondeur extrême sur un segment précis de la biologie ou de l’IA.

Data, éthique et diversité : une complexité plus politique que technique

Au-delà du volume de données, Bioptimus doit composer avec des contraintes qualitatives et éthiques fortes. Toutes les données ne se valent pas, un modèle de pathologie peut sur-interpréter des artefacts liés à un type de scanner, à un protocole de préparation de lames ou à des habitudes de rédaction des comptes rendus par certains pathologistes. La diversité recherchée n’est donc pas uniquement démographique (genre, origine, âge), mais aussi technologique (types de scanners), organisationnelle (types d’hôpitaux et de pratiques) et géographique.

La gestion de ces biais potentiels est centrale, d’abord pour des raisons de performance scientifique, ensuite pour des raisons réglementaires et d’acceptabilité des modèles par les autorités et les cliniciens. C’est également dans ce contexte que s’inscrit la mise en place d’un Scientific Advisory Board composé de chercheurs de premier plan en biologie, en sciences médicales et en machine learning, chargé d’orienter les choix scientifiques, d’ouvrir des portes côté pharma et data providers, et de challenger les architectures de modèles en construction, avec notamment Sarah Teichmann, PhD, Chair of the SAB (University of Cambridge), Andrea Califano, Dr. (Columbia University, CZ Biohub NYC) ou encore Caroline Uhler, PhD (MIT, Broad Institute).

Capital, concurrence et trajectoire produit

Sur le plan concurrentiel, Bioptimus évolue dans un paysage où plusieurs acteurs poursuivent une ambition similaire, parfois avec des moyens financiers bien supérieurs à l’instar de Isomorphic Labs (Alphabet) ou XtalPi en Chine.

En janvier 2025, la startup a bouclé une levée de 41 millions d’euros en Series A menée par Cathay Innovation, avec la participation de Bpifrance (via son fonds Large Venture), Sofinnova Partners, Andera Partners, Hitachi Ventures, Sunrise, Boom Capital Ventures et Pomifer Capital, portant ses financements cumulés à l’équivalent d’environ 76 millions de dollars.  Bioptimus revendique un positionnement discipliné dans l’allocation du capital : choix des pathologies ciblées, arbitrage entre commercialisation précoce et poursuite d’une roadmap de long terme, sélection des jeux de données réellement différenciants plutôt que “spectaculaires” mais vite banalisés. Ce capital doit permettre d’accélérer le développement du premier modèle multimodal commercial, d’élargir l’accès à des données rares et de poursuivre l’objectif, à horizon cinq à dix ans, de construire des jumeaux numériques capables de simuler la biologie de chaque patient, du microscopique au macroscopique.

Derrière Bioptimus se trouve un collectif de scientifiques, ingénieurs et entrepreneurs d’élite, avec à la tête du projet, Jean‑Philippe Vert, co-fondateur et CEO, ancien directeur de recherche chez Owkin et ex-responsable de recherche chez Google Brain, il cumule un très haut niveau académique (École Polytechnique, PhD en mathématiques, plus de 190 publications) et une solide expérience en IA pour les sciences du vivant.

À ses côtés figurent plusieurs co-fondateurs issus des rangs de Google DeepMind et d’Owkin, notamment Rodolphe Jenatton (Chief Technology Officer), Zelda Mariet (VP Research), Felipe Llinares‑López (VP AI), ainsi que David Cahané et Eric Durand, qui apportent des compétences scientifiques pointues en machine learning, IA appliquée à la biologie, bioinformatique et modélisation des données biomédicales.  Ce socle fondateur est complété par un leadership opérationnel et stratégique avec Mathilda Ström, nommée en novembre 2024 Chief Operating Officer

 

Suivez nous:
Bouton retour en haut de la page