Comprendre l'équation de Bellman

Résolu/Fermé
Hr2944 Messages postés 720 Date d'inscription mardi 8 janvier 2019 Statut Membre Dernière intervention 22 janvier 2020 - Modifié le 12 févr. 2019 à 15:26
fouz93 Messages postés 2 Date d'inscription mardi 21 janvier 2014 Statut Membre Dernière intervention 31 juillet 2019 - 31 juil. 2019 à 22:01
Bonjour tous le monde !
Je suis au collège et n'ai donc pas encore vraiment le niveau en math pour comprendre cette équation. Quelqu'un peut m'aider ?
Merci :)

Pour rappel, voilà l'équation en question :
V(s) = max (R(a, s) + y ∑ P(s, a, s')V(s'))
_______a______________s'

Les ____ représentent des espaces, CCM les supprimes quand je valide (a est en dessous de max et s' de ∑ )

1 réponse

Je ne peut pas te la détailler personnellement, mais tu trouvera des choses sur le net:

- https://www.ceremade.dauphine.fr/~carlier/progdyn.pdf
- https://en.wikipedia.org/wiki/Bellman_equation
- http://www.lpsm.paris/pageperso/pham/Tangente.pdf
- https://joshgreaves.com/reinforcement-learning/understanding-rl-the-bellman-equations/

Cette équation est liée à la programmation dynamique:
- https://fr.wikipedia.org/wiki/Programmation_dynamique
- https://openclassrooms.com/fr/courses/1164481-introduction-a-la-programmation-dynamique

Have fun ^^
0
Hr2944 Messages postés 720 Date d'inscription mardi 8 janvier 2019 Statut Membre Dernière intervention 22 janvier 2020 85
Modifié le 13 févr. 2019 à 00:21
Merci :) mais mon principale souci c'est que signifie ceci : R(a, s)
0
fouz93 Messages postés 2 Date d'inscription mardi 21 janvier 2014 Statut Membre Dernière intervention 31 juillet 2019 > Hr2944 Messages postés 720 Date d'inscription mardi 8 janvier 2019 Statut Membre Dernière intervention 22 janvier 2020
31 juil. 2019 à 22:01
R : recompense;
a : action;
s : state(etat);
C'est la recompense de l'action (a) lorsque nous sommes dans l'etat (s)
0
Hr2944 Messages postés 720 Date d'inscription mardi 8 janvier 2019 Statut Membre Dernière intervention 22 janvier 2020 85
17 févr. 2019 à 16:32
Up
0