Tout savoir sur Kyutai
L’intelligence artificielle est une technologie stratégique qui donne aux pays qui la possèdent un avantage considérable. Entre OpenAI, Microsoft et Google, les géants de la Tech américains ont investi massivement dans la recherche et le développement de l’IA. Avec KYUTAI, l’Europe et notamment la France se lancent à la conquête de l’IA.
KYUTAI, le laboratoire de recherche en intelligence artificielle open source
KYUTAI, sphère en japonais, est présenté comme un laboratoire à but non lucratif entièrement dédié à la recherche ouverte en intelligence artificielle (IA). Son objectif est de relever les principaux défis de l’IA moderne en se concentrant notamment sur le développement de grands modèles multimodaux. L’organisation vise également à développer de nouveaux algorithmes afin d’améliorer les capacités, la fiabilité et l’efficacité des modèles.
Le laboratoire dispose de la puissance de calcul de Scaleway, filiale du Groupe Iliad et plus grande puissance de calcul déployée en Europe pour les applications d’IA. Sur ce domaine, KYUTAI se positionne comme un acteur majeur de la recherche ouverte, ou open science. L’objectif est de partager ses avancées avec l’ensemble de l’écosystème de l’IA, qu’il s’agisse des développeurs, des industriels, des citoyens comme des décideurs politiques.
Qui est à l’origine de KYUTAI ?
KYUTAI a été fondé par Iliad et le Groupe CMA-CGM, chacun contribuant à son financement à hauteur de 100 millions d’euros, ainsi que Schmidt Futures. La fondation philanthropique, The Eric & Wendy Schmidt Fund for Strategic Innovation, est également co-fondatrice du projet. KYUTAI souhaite fédérer d’autres investissements privés, de manière à financer sur le long terme les travaux de l’organisation à but non lucratif.
Quand une révolution Tech éclate, on veut en faire partie. Il y a 25 ans, la révolution s’appelait internet, et on était là. Aujourd’hui, elle s’appelle intelligence artificielle, et on est bien décidés à être là aussi. – Xavier Niel, à propos des origines du projet KYUTAI.
Xavier Niel et Iliad
Entrepreneur autodidacte, Xavier Niel est le fondateur de Free et de sa maison mère, Iliad. L’homme d’affaires a également créé Station F, plus grand incubateur de start-up en Europe, ainsi que l’École42, une école aux méthodes originales, qui forme les futurs talents de l’informatique.
Rodolphe Saadé et le groupe CMA-CGM
Troisième armateur mondial, CMA-CGM est dirigée par Rodolphe Saadé depuis 2017. Il est à l’origine de la création de l’incubateur de startups ZEBOX à Marseille. L’homme d’affaires est aussi propriétaire des journaux La Provence, Corse-Matin et La Tribune.
Schmidt Futures et The Eric & Wendy Schmidt Fund for Strategic Innovation
Eric Schmidt a été PDG de Google de 2001 à 2011. Eric et Wendy Schmidt ont créé leur fondation pour relever les défis du monde actuel, en œuvrant pour des énergies renouvelables propres, des océans sains et la protection des droits de l’homme.
Comment KYUTAI est-il financé ?
En plus de la dotation de démarrage du laboratoire, soit 100 millions d’euros du groupe Iliad, Xavier Niel est parvenu à convaincre Rodolphe Saadé et Eric Schmidt d’investir la même somme. Le projet cumule ainsi 300 millions d’euros qui vont lui permettre de financer les quatre premières années de recherche. À la tête du laboratoire, les investisseurs ont nommé Patrick Perez, ancien directeur scientifique du laboratoire valeo.ai.
En outre, la filiale Cloud d’Iliad, Scaleway, met à disposition du laboratoire son supercalculateur à prix coûtant. Ce dernier est annoncé comme la plus grande puissance de calcul déployée en Europe pour les applications d’Intelligence Artificielle. Ce dernier est équipé de GPU NVIDIA H100 Tensor Core, d’une plateforme réseau NVIDIA Quantum-2 InfiniBand non bloquante et d’un stockage DDN haute performance. La machine a ainsi la capacité de s’étendre à des centaines ou des milliers de nœuds.
Les objectifs du laboratoire KYUTAI
« C’est une question de souveraineté : pour protéger nos données, on a besoin de plateformes implantées sur notre territoire. Seulement, il ne suffit pas de faire émerger un champion, mais tout un écosystème français. »
Xavier Niel, co-fondateur de KYUTAI.
Au cœur du projet, l’objectif principal de est de défendre la souveraineté française et européenne, en créant des modèles d’IA pouvant concurrencer les modèles américains déjà installés. De plus, en annonçant aligner les salaires sur ceux offerts par les GAFAM, la fondation marque sa volonté de lutter contre la fuite des cerveaux.
D’ailleurs, Kyutai a débauché son équipe de chercheurs auprès des géants de la Tech. Son conseil scientifique se compose ainsi de Yann Le Cun, directeur de l’IA chez Meta, Yejin Choi, directrice de recherche à l’Allen Institute for AI et Bernhard Schölkopf, directeur du département d’inférence empirique à l’Institut Max-Planck pour les systèmes intelligents. Et parmi les six membres de l’équipe de recherche, trois sont des anciens de FAIR (Facebook Artificial Intelligence Research) et deux de Google DeepMind.
L’Intelligence Artificielle générative en toile de fond
Une des premières échéances du laboratoire est prévue pour septembre 2024. L’équipe travaille au développement d’un modèle d’IA similaire à ChatGPT, mais dans une version multimodale. Il sera capable de comprendre à la fois le texte et l’audio. Surtout, il pourra capter le ton et l’intention dans la voix, comme l’ironie, la colère ou encore la joie. Le but est de proposer une IA générative qui réponde à l’utilisateur de la manière la plus naturelle et intelligente possible.
L’autre aspect des recherches de KYUTAI est de développer des techniques de Watermarking. Il s’agit de marquer clairement les contenus générés par une Intelligence Artificielle, de manière à ce qu’ils soient identifiables, par exemple sur les réseaux sociaux. De même, avec un modèle conversationnel, le laboratoire souhaite limiter le nombre de voix. Le but est d’éviter qu’il puisse être réutilisé à mauvais escient, pour reproduire la voix d’une personne par exemple.
Laboratoire Open-Science, l’exception française
L’un des objectifs principaux des cofondateurs de KYUTAI est de construire et démocratiser l’intelligence artificielle générale grâce à la science ouverte. Ainsi, l’ensemble des travaux seront accessibles librement et gratuitement, de manière à être utilisés par d’autres. Les lignes de codes ayant permis de développer le modèle d’IA pourront ainsi servir à construire d’autres modèles. À l’inverse, les Américains ont aujourd’hui tendance à garder le contrôle de leurs développements. C’est le cas d’OpenAI qui ne divulgue rien. Même Google, qui était plus porté sur l’open source, partage beaucoup moins ses avancées. Aujourd’hui, seul Meta continue de partager ses découvertes.
Les GAFAM tolèrent de moins en moins les publications scientifiques. C’est dommage, car les publications permettent de faire avancer les choses et d’attirer des talents dans ces environnements. – Rodolphe Saadé, co-fondateur de KYUTAI
Par la suite, le projet est annoncé à but non lucratif, comme l’était OpenAI à ses débuts. Le laboratoire parisien pourrait-il suivre le même chemin que le projet de Sam Altman ? Selon Xavier Niel, les modèles qui sortiront du laboratoire n’ont pas vocation à être commercialisés.
« Ça peut paraître bizarre, car nous sommes dans un pays où la philanthropie n’est pas très développée, mais, avec Rodolphe, nous ne faisons que financer ce projet. Nous sommes engagés dans la mise en place d’un bien commun, gratuit et partagé. » Xavier Niel, à propos de l’open-science.
Le recours à l’open source n’est toutefois pas une première dans l’hexagone. C’est sur cette approche que les Français Clément Delangue, Julien Chaumond et Thomas Wolf se sont appuyés pour leur plateforme collaborative Hugging Face. Désormais valorisée à plus de 4 milliards d’euros, la licorne a même été choisie par Meta pour héberger son dernier LLM (Large Language Model) Llama 2.
Le développement de l’Intelligence Artificielle en France
C’est l’un des objectifs du plan France 2030, présenté par le président de la République, Emmanuel Macron : faire de la France une pionnière de l’innovation en 2030. Le Comité de l’intelligence artificielle générative a ainsi été lancé le 19 septembre 2023, réunissant des acteurs de différents secteurs (culturel, économique, technologique, de recherche). Ces derniers ont pour objectif de contribuer à éclairer les décisions du Gouvernement, pour faire du pays une référence en matière d’intelligence artificielle.
Tous les ingrédients sont réunis dans l’hexagone pour parvenir à cet objectif. Le pays dispose d’une recherche mathématique de haut niveau ainsi que d’une grosse puissance de calcul, avec le supercalculateur Jean Zay. Celui-ci a déjà permis de créer le grand modèle de langage BLOOM, pour BigScience Large Open-science Open-access Multilingual Language Model.
Et n’oublions pas que KYUTAI n’est pas le premier laboratoire d’IA français à se lancer dans la course à l’IA. Fondée en 2023, la startup Mistral AI est parvenue à développer son assistant virtuel, Le Chat, en un temps record. Une levée de fonds de 105 millions d’euros a porté sa valorisation à plus de 200 millions d’euros. Notez que parmi les investisseurs, on retrouve les trois cofondateurs de KYUTAI.
Reste désormais à savoir si KYUTAI sera en mesure de rivaliser avec les géants de la Tech, comme OpenAI, Google ou Facebook. Avec la sortie prévue du premier agent conversationnel du projet en septembre 2024, l’accent sera mis sur la capacité de KYUTAI à innover dans le domaine de l’intelligence artificielle conversationnelle et à proposer des solutions compétitives sur le marché.