Comprendre l'équation de Bellman
Résolu
Hr2944
Messages postés
723
Date d'inscription
Statut
Membre
Dernière intervention
-
fouz93 Messages postés 2 Date d'inscription Statut Membre Dernière intervention -
fouz93 Messages postés 2 Date d'inscription Statut Membre Dernière intervention -
Bonjour tous le monde !
Je suis au collège et n'ai donc pas encore vraiment le niveau en math pour comprendre cette équation. Quelqu'un peut m'aider ?
Merci :)
Pour rappel, voilà l'équation en question :
V(s) = max (R(a, s) + y ∑ P(s, a, s')V(s'))
_______a______________s'
Les ____ représentent des espaces, CCM les supprimes quand je valide (a est en dessous de max et s' de ∑ )
Je suis au collège et n'ai donc pas encore vraiment le niveau en math pour comprendre cette équation. Quelqu'un peut m'aider ?
Merci :)
Pour rappel, voilà l'équation en question :
V(s) = max (R(a, s) + y ∑ P(s, a, s')V(s'))
_______a______________s'
Les ____ représentent des espaces, CCM les supprimes quand je valide (a est en dessous de max et s' de ∑ )
A voir également:
- Equation de bellman
- Editeur d'équation - Télécharger - Vie quotidienne
- Formule équation - Télécharger - Études & Formations
- Equation sinequanone - Télécharger - Calcul & Conversion
- Écrire un programme qui résout une équation du second degré ✓ - Forum C
- Pourquoi je ne peux pas insérer une équation dans word - Forum Microsoft Office
1 réponse
Je ne peut pas te la détailler personnellement, mais tu trouvera des choses sur le net:
- https://www.ceremade.dauphine.fr/~carlier/progdyn.pdf
- https://en.wikipedia.org/wiki/Bellman_equation
- http://www.lpsm.paris/pageperso/pham/Tangente.pdf
- https://joshgreaves.com/reinforcement-learning/understanding-rl-the-bellman-equations/
Cette équation est liée à la programmation dynamique:
- https://fr.wikipedia.org/wiki/Programmation_dynamique
- https://openclassrooms.com/fr/courses/1164481-introduction-a-la-programmation-dynamique
Have fun ^^
- https://www.ceremade.dauphine.fr/~carlier/progdyn.pdf
- https://en.wikipedia.org/wiki/Bellman_equation
- http://www.lpsm.paris/pageperso/pham/Tangente.pdf
- https://joshgreaves.com/reinforcement-learning/understanding-rl-the-bellman-equations/
Cette équation est liée à la programmation dynamique:
- https://fr.wikipedia.org/wiki/Programmation_dynamique
- https://openclassrooms.com/fr/courses/1164481-introduction-a-la-programmation-dynamique
Have fun ^^
a : action;
s : state(etat);
C'est la recompense de l'action (a) lorsque nous sommes dans l'etat (s)