L'équipe de Yann LeCun propose une méthode de planification hiérarchique, améliorant la capacité de raisonnement à long terme du modèle mondial JEPA

robot
Création du résumé en cours

Actualités ME News, 8 avril (UTC+8), récemment, l’équipe de Yann LeCun a proposé une méthode de planification hiérarchique basée sur un modèle de monde latent à plusieurs échelles de temps, visant à résoudre deux grands défis rencontrés par les modèles de monde appris dans le contrôle à long terme : l’accumulation d’erreurs de prédiction et la croissance exponentielle de l’espace de recherche.
Cette méthode apprend un modèle de monde latent à différentes échelles de temps et exécute une planification hiérarchique inter-échelles, permettant un raisonnement à long terme tout en réduisant considérablement la complexité de la planification lors de l’inférence.
Ce cadre peut servir de module d’abstraction plug-in, adapté à diverses architectures de modèles de monde latent et domaines.
Les expériences montrent qu’en tâche de robot non avide dans le monde réel (comme la prise et la pose), en ne fournissant que l’objectif final, la planification hiérarchique atteint un taux de succès de 70 %, tandis que le modèle de monde à une seule couche affiche un taux de succès de 0 %.
Dans des environnements simulés basés sur la physique (comme la manipulation de poussée et la navigation dans un labyrinthe), la planification hiérarchique obtient un taux de réussite plus élevé tout en réduisant jusqu’à trois fois le temps de calcul nécessaire à la planification.
Cette méthode ne dépend pas de récompenses spécifiques à la tâche ni de sous-objectifs fournis par l’extérieur, démontrant une forte capacité de généralisation dans des environnements et tâches non rencontrés auparavant.
(Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler