ENFR
8news

Tech • IA • Crypto

Aujourd'huiMa veilleVidéosTop articles 24hArchivesFavorisMes topics

Construire l’avenir de l’IA souveraine centrée sur la voix : Sarvam & NVIDIA

NvidiaNVIDIA1 juin 2026 à 05:312:37
Lecteur audio
0:00 / 0:00

INTRO

Une initiative d’IA basée en Inde construit un écosystème d’IA entièrement souverain et open source pour les langues indiennes, soutenu par des données à grande échelle, une infrastructure Nvidia et un déploiement à l’échelle de la population.

POINTS CLÉS

Développement IA full-stack

L’initiative vise à construire des systèmes d’IA de bout en bout, couvrant les jeux de données, le développement des modèles et le déploiement des applications. Cette approche intégrée permet un contrôle plus fin des performances, de l’optimisation et de la qualité sur toute la chaîne, plutôt que de dépendre de composants externes.

Stratégie souveraine et open source

Un objectif central est la souveraineté technologique, garantissant que les systèmes d’IA soient développés et détenus localement. L’effort met l’accent sur l’open source, favorisant l’accès et la transparence tout en réduisant la dépendance aux plateformes étrangères.

Focus sur les langues indiennes

Le projet cible la complexité et la diversité des langues indiennes, en traitant des défis comme la variation linguistique et le manque de données représentatives. Cela inclut la gestion de cas linguistiques de longue traîne souvent ignorés par les systèmes d’IA mondiaux.

Données massives et entraînement à grande échelle

Des modèles de langage de grande taille ont été entraînés depuis zéro à partir de jeux de données comprenant des dizaines de milliers de milliards de tokens, des millions d’heures d’audio et des milliards d’images. Des pipelines de curation étendus garantissent la qualité, avec des outils comme Nvidia NeMo Curator.

Techniques avancées d’entraînement IA

Les modèles exploitent le pré-entraînement, le fine-tuning et l’apprentissage par renforcement, ce dernier apportant des gains de performance constants à grande échelle. L’entraînement et l’inférence s’appuient sur l’architecture GPU Hopper de Nvidia et le framework NeMo.

Déploiement d’API à haut volume

La plateforme gère actuellement plus de 4 millions d’appels API par jour, ce qui en fait l’un des plus grands déploiements d’API d’IA issus d’Inde. Cela reflète à la fois la scalabilité et l’adoption réelle.

Écosystème développeur et évolution du calcul

Avec une vaste base de développeurs, l’initiative encourage la création de systèmes d’IA plutôt que leur simple consommation. Elle souligne l’importance croissante des compétences en calcul accéléré et en stacks logiciels dédiés à l’IA.

Vision d’une IA à l’échelle de la population

L’objectif global est de fournir des systèmes d’IA reflétant la diversité de l’Inde et opérant à l’échelle nationale, dépassant les usages de niche pour un impact sociétal large.

CONCLUSION

Cette initiative marque une avancée vers une infrastructure d’IA souveraine à grande échelle en Inde, combinant open source, calcul avancé et inclusion linguistique pour servir une population vaste et diverse.

Transcription complète

We always believed that AI is such a critical technology that a country of the size of India, we should be building AI grounds up in India. So the two main focus areas for us are the ability to do full stack. We go from uh the data sets required to the models to be built and also the applications uh that can be built on these models. And the second thing is we want to do it with foundational research uh which can improve each of these layers while being completely sovereign about it. We took up the problem of doing it for Indian languages and doing it completely in open source. We understood the nuances of languages, the long tale of challenges and so on. And that's where Serum was born. We have an API platform today uh which serves more than 4 million API calls a day. By far the largest AI API effort out of India. And we're doing all of this on technologies. We're using the entire Nvidia stack for training these models and inferencing them at scale. So doing this entire thing of the platform, the model and the applications gives us lot more levers of optimization and quality. For all the work that we do at Saram, we start with data. Uh and data requires curation entire pipelines around ensuring that the quality of data is good and we've been extensively using the Nemo curator platform. In fact, we have trained now large language models from scratch and all that data for tens of trillions of tokens for millions of hours of audio, billions of images. All of that has flown through Nemo curator and that tool has really scaled and now we understand that deeply and the value it brings. The training itself we have done with the Nemo framework. The pre-training, the fine-tuning, the reinforcement learning. In fact, reinforcement learning is something that's giving consistent dividends at scale and we've been using the Nemo RL framework for that. And of course we have been um doing inferencing with our models at at some fair scale. So we've been using training and inferencing stacks extensively primarily on the hopper series of GPUs. In India having such a large developer base I think should be building AI not just consuming AI and that requires being expert in the new stack of software for accelerated compute. Nvidia stack is one great example of where people can do this. I genuinely believe developers should think about this as the core of development going ahead because whatever we build will hit these genative AI models. With NVIDIA, we are looking really forward to building models that represent the diversity of India and also serve them at scale so that it actually is a population scale effort rather than a few people just using them.

Sur le même sujet : Nvidia