La startup berlinoise Mirelo, spécialisée dans la génération automatisée d’effets sonores synchronisés pour la vidéo, vient de lever environ 35 millions d’euros en seed lors d’un tour co-mené par Index Ventures et Andreessen Horowitz, avec la participation d’Atlantic.vc et TriplePoint Capital. Une levée de fonds significative pour une société fondée en 2023, sur un segment encore peu structuré de l’IA générative.

Si le texte, l’image et la vidéo ont connu une accélération rapide sous l’effet de l’intelligence artificielle, le son reste largement en retrait. Dans la plupart des workflows, l’ajout d’effets sonores ou de musique repose encore sur des bibliothèques de contenus existants et sur un travail manuel de synchronisation, souvent long et coûteux.

Automatiser une étape encore largement artisanale

La startup développe ses propres modèles fondationnels audio capables d’analyser une vidéo et de générer automatiquement des effets sonores cohérents avec ce qui se déroule à l’écran. En pratique, un utilisateur peut importer une vidéo et obtenir, en quelques secondes, une bande sonore synchronisée, sans intervention manuelle.

Ce type de technologie répond à une contrainte de plus en plus visible à mesure que les contenus se multiplient. Vidéos générées par IA, formats courts, jeux vidéo adaptatifs ou environnements interactifs nécessitent des capacités de production sonore rapides, parfois plus rapides que le temps réel, difficilement compatibles avec les méthodes traditionnelles.

Une approche audio-native, distincte des modèles généralistes

Contrairement aux grands modèles de langage ou de vision, les modèles développés par Mirelo sont conçus spécifiquement pour l’audio. La startup met en avant des architectures plus légères, nécessitant nettement moins de ressources de calcul, tout en restant adaptées aux contraintes propres au son, notamment la temporalité et la synchronisation avec l’image.

Cette spécialisation reflète une approche différente de l’IA générative, davantage orientée vers des usages précis que vers des modèles généralistes capables de tout faire. Mirelo propose aujourd’hui ses technologies via une API ainsi qu’une application web, Mirelo Studio, destinée aussi bien aux créateurs indépendants qu’aux professionnels de l’audiovisuel.

Une équipe issue de la recherche et de la pratique musicale

Mirelo a été fondée par CJ Simon-Gabriel et Florian Wenzel, tous deux chercheurs en intelligence artificielle, passés par AWS Labs et Google Brain. Leur parcours académique s’accompagne d’une pratique musicale affirmée, cette double culture scientifique et artistique structure l’approche de Mirelo, qui cherche à automatiser les tâches techniques liées au son, sans se substituer au travail créatif des professionnels, mais en leur permettant de se concentrer sur des choix artistiques plutôt que sur des opérations de synchronisation.