
Meta mise sur la donnée et s’apprête à faire un chèque de 10 milliards pour échapper au piège OpenAI
📩 Pour nous contacter: redaction@frenchweb.fr
Meta envisagerait d’investir plus de 10 milliards de dollars dans Scale AI, une startup spécialisée dans l’annotation de données pour l’intelligence artificielle, selon des informations rapportées par Bloomberg. Si l’opération se concrétise, elle deviendrait non seulement l’un des plus importants financements privés jamais réalisés dans le secteur, et marquerait aussi un tournant stratégique pour Meta, historiquement attachée à une R&D internalisée.
TL;DR – Meta mise sur Scale AI : un virage stratégique majeur vers l’infrastructure IA
👥 Pour qui est-ce important ?
- Décideurs stratégiques en IA et infrastructures cloud
- Investisseurs tech surveillant les mouvements de capital dans l’IA
- Acteurs publics et privés impliqués dans les usages civils ou militaires de l’IA
- Startups positionnées sur les chaînes de valeur amont de l’IA
💡 Pourquoi c’est stratégique ?
- Meta rompt avec sa doctrine de R&D internalisée en envisageant d’investir >10 Md$ dans Scale AI
- Scale AI maîtrise une couche critique : la donnée annotée à large échelle, pilier de l’IA générative
- L’opération renforcerait Meta face à Microsoft et Amazon, déjà intégrés à tous les niveaux de la stack IA
- Elle s’inscrit dans une convergence croissante entre IA civile et militaire (Defense LLaMA, contrat DoD)
🔧 Ce que ça change concrètement
- Meta consoliderait sa chaîne d’entraînement IA sans dépendre exclusivement de ses infrastructures internes
- Scale AI deviendrait un fournisseur clé pour les grands modèles et agents autonomes
- Le marché de l’annotation s’industrialise : fragmentation actuelle, mais montée en puissance des plateformes stratégiques
- Les entreprises devront combiner outils internes et prestataires spécialisés pour sécuriser leur pipeline IA
Une rupture dans la stratégie de Meta en matière d’IA
Depuis plusieurs années, Meta se distingue de ses concurrents par son choix d’une approche autonome et open source dans le développement de ses modèles d’IA. Contrairement à Microsoft, Amazon ou Google, qui ont respectivement investi dans OpenAI, Anthropic et d’autres modèles propriétaires, Meta a misé sur LLaMA, ses infrastructures internes et un écosystème ouvert.
L’investissement envisagé dans Scale AI semble déroger à cette règle et le montant évoqué, supérieur à 10 milliards de dollars, placerait cet engagement au même niveau que celui de Microsoft dans OpenAI. Ce serait la plus grosse opération externe jamais réalisée par Meta dans l’IA dont le format exact du deal n’est pas connu à ce stade.
Scale AI, maillon essentiel de la chaîne d’entraînement
Fondée en 2016 par Alexandr Wang, Scale AI fournit des services de structuration et d’annotation de données pour entraîner des modèles d’apprentissage automatique. L’entreprise collabore avec Microsoft, OpenAI, et plus récemment, avec le Département américain de la Défense. La startup est en hypercroissance depuis sa création et génère des revenus significatifs, avec 870 millions de dollars de chiffre d’affaires en 2024, et une prévision à 2 milliards pour 2025, selon Bloomberg.
La startup était valorisée à 14 milliards de dollars lors de son dernier tour de table en 2024. Une opération secondaire, évoquée en début d’année, laissait entrevoir une valorisation de 25 milliards de dollars. À ce stade, aucun des acteurs concernés n’a souhaité commenter les négociations.
L’atout principal de Scale AI repose sur sa capacité à produire, structurer et fiabiliser des volumes massifs de données. Ces données sont utilisées pour entraîner des modèles à large échelle, mais aussi pour calibrer des agents IA destinés à des usages spécifiques, civils comme militaires. Cette maîtrise de la donnée labellisée est l’une ressource critique de l’IA générative.
Une convergence autour des usages défense
Ce rapprochement s’inscrit également dans un contexte de coopération croissante entre les entreprises technologiques et le secteur de la défense. Meta a récemment annoncé un partenariat avec Anduril Industries pour le développement de casques augmentés à usage militaire. Elle autorise désormais explicitement l’usage de ses modèles LLaMA par les agences gouvernementales américaines.
Parallèlement, Scale a renforcé sa présence dans ce domaine. L’entreprise a signé un contrat avec le Département de la Défense pour développer des agents IA et travaille sur une version militarisée de LLaMA, baptisée « Defense LLaMA », en partenariat avec Meta. Ce glissement vers des usages duals (civils et militaires) pourrait expliquer, en partie, l’intérêt stratégique de Meta pour Scale.
Derrière les modèles, la bataille des infrastructures
L’attention portée aux modèles d’IA (GPT-4, Claude, Gemini) masque une réalité plus structurelle : la performance d’un système d’IA dépend en grande partie des infrastructures sur lesquelles il repose. Cette infrastructure ne se limite pas aux puces. Elle comprend plusieurs couches critiques, de plus en plus interdépendantes :
- La donnée : sans jeux de données annotés, spécialisés, représentatifs, les modèles ne peuvent ni apprendre, ni généraliser. C’est le rôle qu’occupent des acteurs comme Scale AI ou Sama.
- Le calcul : les GPU, en particulier ceux de NVIDIA (H100, A100), restent au cœur de l’entraînement et de l’inférence. Les tensions sur l’approvisionnement, la dépendance à TSMC, et l’émergence d’alternatives comme les TPU de Google ou les puces d’Amazon (Trainium, Inferentia) reconfigurent les rapports de force.
- Les frameworks logiciels : des outils comme PyTorch, TensorFlow ou JAX permettent aux chercheurs et ingénieurs de construire et d’expérimenter rapidement. Leur contrôle devient stratégique, comme le montre la prise en main de PyTorch par la Linux Foundation.
- L’orchestration et le déploiement : entraîner un modèle n’est que la première étape. La gestion des versions, la supervision, la mise à l’échelle et l’intégration dans les flux métiers sont assurées par des plateformes comme Weights & Biases, Hugging Face, MosaicML ou des environnements cloud spécialisés (Azure ML, SageMaker, Vertex AI).
- La sécurité et la gouvernance : l’usage d’agents autonomes dans des contextes sensibles (santé, défense, finance) impose de nouvelles exigences en matière de traçabilité, de robustesse et de supervision humaine.
Dans ce paysage, Scale AI incarne un acteur de l’infrastructure « amont », celle qui précède l’entraînement mais en conditionne la validité. L’émergence de ces couches intermédiaires marque une industrialisation croissante de l’IA, où la différenciation ne passe plus seulement par les modèles, mais par la maîtrise de l’ensemble de la chaîne logistique algorithmique.
Le marché de l’annotation de données, entre fragmentation et spécialisation
Le marché de l’annotation de données reste fragmenté, structuré autour de plusieurs approches complémentaires. Scale AI occupe une position centrale sur les projets à grande échelle, avec un fort degré d’automatisation, une infrastructure logicielle propriétaire et une orientation vers des clients stratégiques, publics comme privés. D’autres acteurs misent sur des positionnements différenciés, Sama, par exemple, externalise ses opérations en Afrique et se positionne sur une approche « éthique » de l’annotation, avec un ancrage dans l’impact social. À l’opposé, Snorkel AI propose une annotation sans intervention humaine, basée sur des règles programmatiques, dans une logique « data-centric AI ».
D’autres solutions comme Labelbox ou Hive AI permettent aux équipes internes des entreprises de garder la main sur leurs pipelines de données, via des plateformes SaaS ou des modèles hybrides. Enfin, des prestataires comme CloudFactory proposent des services d’annotation externalisés, à bas coût, pour des besoins de volume élevé et de standardisation.
La tendance actuelle est à la combinaison de plusieurs approches, conjugant des outils internes pour les données sensibles ou propriétaires, et des prestataires spécialisés pour accélérer la mise à l’échelle. Dans ce paysage, Scale AI se distingue par sa capacité à traiter des corpus massifs tout en s’adaptant à des cas d’usage complexes, notamment dans les domaines militaire, industriel ou réglementaire.
En choisissant de soutenir Scale plutôt qu’un éditeur de modèle concurrent, Meta parie sur une infrastructure critique, difficile à reproduire à grande échelle, et capable de servir ses ambitions tant commerciales que stratégiques. L’investissement envisagé rééquilibrerait ses positions dans une compétition où Microsoft et Amazon ont déjà pris une longueur d’avance grâce à leur double présence sur les modèles et sur le cloud.
- Meta mise sur la donnée et s’apprête à faire un chèque de 10 milliards pour échapper au piège OpenAI - 09/06/2025
- Connaissez-vous Scale AI, l’opérateur discret de la chaîne d’entraînement des modèles d’IA ? - 09/06/2025
- Alexandr Wang, à la croisée de l’IA, des données et de la souveraineté technologique - 09/06/2025