Comprendre l'équation de Bellman

Résolu
Hr2944 Messages postés 744 Date d'inscription   Statut Membre Dernière intervention   -  
fouz93 Messages postés 7 Statut Membre -
Bonjour tous le monde !
Je suis au collège et n'ai donc pas encore vraiment le niveau en math pour comprendre cette équation. Quelqu'un peut m'aider ?
Merci :)

Pour rappel, voilà l'équation en question :
V(s) = max (R(a, s) + y ∑ P(s, a, s')V(s'))
_______a______________s'

Les ____ représentent des espaces, CCM les supprimes quand je valide (a est en dessous de max et s' de ∑ )

1 réponse

  1. T3ch
     
    Je ne peut pas te la détailler personnellement, mais tu trouvera des choses sur le net:

    - https://www.ceremade.dauphine.fr/~carlier/progdyn.pdf
    - https://en.wikipedia.org/wiki/Bellman_equation
    - http://www.lpsm.paris/pageperso/pham/Tangente.pdf
    - https://joshgreaves.com/reinforcement-learning/understanding-rl-the-bellman-equations/

    Cette équation est liée à la programmation dynamique:
    - https://fr.wikipedia.org/wiki/Programmation_dynamique
    - https://openclassrooms.com/fr/courses/1164481-introduction-a-la-programmation-dynamique

    Have fun ^^
    0
    1. Hr2944 Messages postés 744 Date d'inscription   Statut Membre Dernière intervention   87
       
      Merci :) mais mon principale souci c'est que signifie ceci : R(a, s)
      0
      1. fouz93 Messages postés 7 Statut Membre > Hr2944 Messages postés 744 Date d'inscription   Statut Membre Dernière intervention  
         
        R : recompense;
        a : action;
        s : state(etat);
        C'est la recompense de l'action (a) lorsque nous sommes dans l'etat (s)
        0
    2. Hr2944 Messages postés 744 Date d'inscription   Statut Membre Dernière intervention   87
       
      Up
      0