Il y a un peu plus de deux ans, Hugging Face annonçait un tour de table de 13,5 millions d’euros pour confirmer son pivot. Alors qu’elle développait depuis ses débuts en 2016 un chatbot pour interagir avec les adolescents, la start-up franco-américaine a en effet décidé de faire évoluer son modèle fin 2018 pour mettre en place un projet beaucoup plus ambitieux visant à mutualiser les forces des chercheurs et des entreprises pour développer une meilleure compréhension du langage naturel.

Pour créer un véritable écosystème autour du traitement du langage naturel, les deux entrepreneurs français basés à New York ont opté pour une approche open-source. «Une seule entreprise, même parmi les GAFA, ne sera pas capable de produire cette fantastique avancée pour l’humanité qu’est la compréhension du langage. Travailler de manière open-source avec toute la communauté est pour nous la seule solution d’y arriver», estimait alors Julien Chaumond, co-fondateur et directeur technique de Hugging Face.

Deux ans et demi après le lancement de Transformers, une librairie open-source à destination des scientifiques et ingénieurs pour construire des modèles de machine learning appliqués au traitement du langage naturel (classification de texte, génération de texte, extraction d’information…), la société se voit confortée dans cette voie. La société annonce aujourd’hui une levée de 40 millions de dollars menée par Lee Fixel et son fonds Addition, ainsi que ses investisseurs historiques, A.Capital Ventures, le fonds de Ronny Conway, l’un des premiers investisseurs d’Instagram, Lux Capital et Betaworks. Des investisseurs français ont également pris part à l’opération, à l’image d’Olivier Pomel (Datadog), Florian Douetteau (Dataiku), Thibaud Elzière (eFounders), Ludovic Huraux (Shapr) encore Nicolas Steegmann (Stupeflix). Le joueur de basket Kevin Durant (Brooklyn Nets en NBA) soutient aussi le projet.

Hugging Face entend s’appuyer sur ce financement pour «construire la plus grosse communauté de machine learning». Celle-ci compte aujourd’hui plus de 5 000 contributeurs, qui sont pour la plupart des chercheurs spécialisés dans le traitement du langage naturel travaillant pour Google, Microsoft et Facebook. Ces derniers alimentent la librairie open-source Transformers, utilisée par plus de 5 000 entreprises, dont Microsoft pour son moteur de recherche Bing et la néobanque britannique Monzo pour améliorer sa relation client. Cette approche permet d’analyser des articles de presse, des commentaires ou n’importe quel texte pour en extraire le sens et les points clés, faire de la modération, ou encore trier des informations.

Aux yeux de Julien Chaumond, co-fondateur et directeur technique de Hugging Face, ce nouveau tour de table est «une nouvelle validation pour notre modèle de machine learning en open-source». Il ajoute : «En s’inspirant des modèles open-source pour les bases de données, l’infrastructure et le code (GitHub, Databricks, Elastic, Mongodb, Confluent…), nous prouvons qu’il est possible de créer un leader mondial sur le machine learning en s’appuyant sur la communauté.» Cette opération intervient alors que la société indique être en cash-flow positif sur les premiers mois de l’année 2021 et disposer encore de 90% des fonds de la précédente levée. Mais l’heure est venue d’accélérer pour prouver que l’open-source est une voie viable dans le développement d’une entreprise.

Hugging Face : les données clés

Fondateurs : Clément Delangue et Julien Chaumond

Création : 2016

Siège social : Paris

Secteur : IA

Activité : open-source

Financement : 40 millions de dollars en mars 2021, 13,5 millions d’euros en décembre 2019, 4 millions de dollars en mai 2018…