HiVLA : un système hiérarchique de manipulation incarnée ancré visuellement
HiVLA est un système innovant qui combine des modèles vision-langage pour améliorer le raisonnement et les capacités de manipulation robotique autonome. Ce système hiérarchique favorise une meilleure généralisation des actions des agents robotiques dans des environnements variés, marquant une avancée majeure pour les agents autonomes incarnés.
