Programmer un réseau de neurones
Résolu/Fermé
A voir également:
- Programmer un perceptron en python
- Programmer un sms - Guide
- Programmer un mail gmail - Guide
- Citizen code python avis - Accueil - Outils
- Mettre en veille un programme - Guide
88 réponses
matmdx
Messages postés
30
Date d'inscription
jeudi 10 avril 2003
Statut
Membre
Dernière intervention
2 avril 2005
34
20 mars 2005 à 13:02
20 mars 2005 à 13:02
Bon OK tu as gagné ! ;-)
C'est vrai j'ai été un peu bourrin sur les mesures, mais bon au moins comme ça j'ai des résultats concrets à présenter !
>>> "Et c'est alors une très bonne idée de faire d'autres expériences pour pouvoir la confirmer (plutôt qu'une preuve quantitative), sauf que tu ne pourras pas, dans ton cas, affirmer plus que ton résultat actuel. Je m'explique : si tu trouves toujours une relation rac(b)*a=constante , tu ne seras pas plus sûr de sa validité que maintenant, car les nouvelles expériences seront trop proche de l'ancienne (tu te contente de faire varier le nombre de neurones de la couche cachée, alors que pour valider d'équation, il faudrait chager entièrement le réseau, et même le problème posé !)" <<<
Je sais très bien que la formule que j'ai trouvé ne sera .pas valable avec d'autres réseau (ou d'autres modèles d'apprentissage), mais ce que je voudrais voir c'est, pour ce réseau, si la formule est toujours (je sais pas si ça va me servir à grand chose, mais tant qu'à être bourrin, autant l'être jusqu'au bout !)
Sinon pour les mesures, c'est trop tard : elles sont faites (les PC ont tournés un peu cette nuit...).
A première il semblerait donc que le nombre de neurones de la couche cachée, et le nombre de modèles d'apprentissage n'aient pas d'influence sur la localisation des minimums de la courbes !
La formule serait donc tout le temps vraie (pour ce réseau bien sur !!) (résultats à vérifier).
@+,
Matthieu
C'est vrai j'ai été un peu bourrin sur les mesures, mais bon au moins comme ça j'ai des résultats concrets à présenter !
>>> "Et c'est alors une très bonne idée de faire d'autres expériences pour pouvoir la confirmer (plutôt qu'une preuve quantitative), sauf que tu ne pourras pas, dans ton cas, affirmer plus que ton résultat actuel. Je m'explique : si tu trouves toujours une relation rac(b)*a=constante , tu ne seras pas plus sûr de sa validité que maintenant, car les nouvelles expériences seront trop proche de l'ancienne (tu te contente de faire varier le nombre de neurones de la couche cachée, alors que pour valider d'équation, il faudrait chager entièrement le réseau, et même le problème posé !)" <<<
Je sais très bien que la formule que j'ai trouvé ne sera .pas valable avec d'autres réseau (ou d'autres modèles d'apprentissage), mais ce que je voudrais voir c'est, pour ce réseau, si la formule est toujours (je sais pas si ça va me servir à grand chose, mais tant qu'à être bourrin, autant l'être jusqu'au bout !)
Sinon pour les mesures, c'est trop tard : elles sont faites (les PC ont tournés un peu cette nuit...).
A première il semblerait donc que le nombre de neurones de la couche cachée, et le nombre de modèles d'apprentissage n'aient pas d'influence sur la localisation des minimums de la courbes !
La formule serait donc tout le temps vraie (pour ce réseau bien sur !!) (résultats à vérifier).
@+,
Matthieu
je voudrais programmer un RBF et l'utiliser pour la detection de tumeur, et cela a partir d'une image segmentee.
franky*
Messages postés
165
Date d'inscription
mardi 7 décembre 2004
Statut
Membre
Dernière intervention
4 décembre 2008
5
22 mars 2005 à 13:12
22 mars 2005 à 13:12
Bonjour Sarah,
je ne connais rien aux tumeurs, et je ne sais pas comment tu segmentes ton image... Donc explique un peu plus précisement ton problème, comme ça on pourra peut-être t'aider !
De rien,
François
je ne connais rien aux tumeurs, et je ne sais pas comment tu segmentes ton image... Donc explique un peu plus précisement ton problème, comme ça on pourra peut-être t'aider !
De rien,
François
merci de m'avoir consacrer de votre temps si présieux
bon mon sujet est l'interprétation des images médicales avec le reseau RBF
càd : l'étape de segmentation de l'image nous permet d'obtenir ses caracteristiques qui representent les entrées du réseau et comme sortie je doit avoir le resultat de la detection (l'existence du tumeur)
je comprend le mécanisme du RBF (càd je represente les entrées=les caracteristiques de l'image commes des vecteurs ;une seule couche cache; deux neurones dans la sortie par exple )
mais ce que je cherche combien de neurones dans la couche cachéeet comment la construire càd comment appliquée la fonction gaussienne et surtout dans l'implémentation du reseau
svp explique moi bien et meme si ta une documentation interessente dans le domaine envoyez la car je suis pas forte en programmation en builderc++
merci
bon mon sujet est l'interprétation des images médicales avec le reseau RBF
càd : l'étape de segmentation de l'image nous permet d'obtenir ses caracteristiques qui representent les entrées du réseau et comme sortie je doit avoir le resultat de la detection (l'existence du tumeur)
je comprend le mécanisme du RBF (càd je represente les entrées=les caracteristiques de l'image commes des vecteurs ;une seule couche cache; deux neurones dans la sortie par exple )
mais ce que je cherche combien de neurones dans la couche cachéeet comment la construire càd comment appliquée la fonction gaussienne et surtout dans l'implémentation du reseau
svp explique moi bien et meme si ta une documentation interessente dans le domaine envoyez la car je suis pas forte en programmation en builderc++
merci
Vous n’avez pas trouvé la réponse que vous recherchez ?
Posez votre question
Neurone RBF -> Bien !!! Puisque tu cherche à faire le rapprochement avec une valeur "prototype" de ton vecteur.
Combien de neurones -> Autant que de classe disctincte dans ton corpus d'apprentissage. Càd que si deux exemples se ressemble, ils peuvent être reconnu par le même neurone, donc il n'y a qu'une seule classe.
Gaussienne -> Tu fixe l'écart type au départ, puis tu lance l'apprentissage pour déterminer automatiquement le centre de chacune (point qui sera désigné comme "prototype", c'est à l'exemple que le neurone reconnaitrait à 100% (mais qui n'est pas forcément un des exemple de la base d'apprentissage).
Ceci dis, si tu fait du monocouche, je t'invite à relire tout ce qui a été dis à propos des cartes auto-organisatrices (Self Organising Map, Carte de Kohonen).
Il existe ensuite des algos comme GNG (Growing Neural Gas) qui déterminent automatiquement le nombre de prototypes (donc le nombre de neurone de la couche cachée).
Par contre, la couche de sortie est-elle bien utile ???
Cela dépend du problème. Soit un "nouvel exemple" (de test) ne peux ressembler qu'à un seul exemple (prototype) reconnu par le réeau, alors la couche de sortie est inutile. Un p'tit algo qui vérifie s'il un des neurones est suffisemement activé, lequel, et TAC !! Tu y est.
Plus complexe, si un exemple de la base de test (ou en exploitation) peut-être une sorte de "mix" de deux prototype, alors là oui, la couche supplémentaire est nécessaire.
Tu pourra t'en rendre compte facilement, une fois le GNG appliqué, l'apprentissage effectué : Tu passe ton corpus de test, et pour chaque exemple (tu peux, préférentiellement, faire un p'tit bout de code qui le fait à ta place) vérifie combien de neurone sont activés, le ratio relatif, etc...
Fait quand même aussi gaffe aux contre-exemples (genre pour une image d'un type sain, il faut qu'aucun neurone ne soit activé, si pourtant un ou quelques neurones présentent une forte activitée), alors une couche supérieure est nécessaire.
Comme couche supérieure, je verrais plus un (voire des) neurones type "sigmoîde" (perceptron, EVENTUELLEMENT multi-couche).
PS : Fanky* : ils vont bien agents ? Ils émmerge un peu ou quoi ?? ;°)
Combien de neurones -> Autant que de classe disctincte dans ton corpus d'apprentissage. Càd que si deux exemples se ressemble, ils peuvent être reconnu par le même neurone, donc il n'y a qu'une seule classe.
Gaussienne -> Tu fixe l'écart type au départ, puis tu lance l'apprentissage pour déterminer automatiquement le centre de chacune (point qui sera désigné comme "prototype", c'est à l'exemple que le neurone reconnaitrait à 100% (mais qui n'est pas forcément un des exemple de la base d'apprentissage).
Ceci dis, si tu fait du monocouche, je t'invite à relire tout ce qui a été dis à propos des cartes auto-organisatrices (Self Organising Map, Carte de Kohonen).
Il existe ensuite des algos comme GNG (Growing Neural Gas) qui déterminent automatiquement le nombre de prototypes (donc le nombre de neurone de la couche cachée).
Par contre, la couche de sortie est-elle bien utile ???
Cela dépend du problème. Soit un "nouvel exemple" (de test) ne peux ressembler qu'à un seul exemple (prototype) reconnu par le réeau, alors la couche de sortie est inutile. Un p'tit algo qui vérifie s'il un des neurones est suffisemement activé, lequel, et TAC !! Tu y est.
Plus complexe, si un exemple de la base de test (ou en exploitation) peut-être une sorte de "mix" de deux prototype, alors là oui, la couche supplémentaire est nécessaire.
Tu pourra t'en rendre compte facilement, une fois le GNG appliqué, l'apprentissage effectué : Tu passe ton corpus de test, et pour chaque exemple (tu peux, préférentiellement, faire un p'tit bout de code qui le fait à ta place) vérifie combien de neurone sont activés, le ratio relatif, etc...
Fait quand même aussi gaffe aux contre-exemples (genre pour une image d'un type sain, il faut qu'aucun neurone ne soit activé, si pourtant un ou quelques neurones présentent une forte activitée), alors une couche supérieure est nécessaire.
Comme couche supérieure, je verrais plus un (voire des) neurones type "sigmoîde" (perceptron, EVENTUELLEMENT multi-couche).
PS : Fanky* : ils vont bien agents ? Ils émmerge un peu ou quoi ?? ;°)
franky*
Messages postés
165
Date d'inscription
mardi 7 décembre 2004
Statut
Membre
Dernière intervention
4 décembre 2008
5
31 mars 2005 à 18:21
31 mars 2005 à 18:21
>> PS : Fanky* : ils vont bien agents ? Ils émmerge un peu ou quoi ?? ;°)
Ils émergent autant que moi... C'est-à-dire quand ils ont le temps...
Nan, sérieusement, ça marche très bien en ce moment, et autant que mon message soit utile : si quelqu'un veut utiliser des systèmes multi-agents, utilisez NetLogo (gratuit) -> des super programmes en 30 lignes de prog !!!!! 8-)
Ils émergent autant que moi... C'est-à-dire quand ils ont le temps...
Nan, sérieusement, ça marche très bien en ce moment, et autant que mon message soit utile : si quelqu'un veut utiliser des systèmes multi-agents, utilisez NetLogo (gratuit) -> des super programmes en 30 lignes de prog !!!!! 8-)
Bon vous avez dis que des choses intelligentes avec les quelles je suis d'accord
(d'ailleurs, Francky, +1 pour ta méthode. Ceci dis, juste une chose : je ne pense pas que calculer la surface soit un pb, il suffit de passer la base de test une fois pour chaque "couple de poids variable".
En une nuit de simu, si t'as pas une courbe à plusieurs minima, engueule ta copine, Mat')
Que des choses intelligentes disais-je, donc je trolle :
Mat >> de très belles surfaces qui représentent des puits de potentiel
T'as fait trop de physique quantique, toi.. T'as réussi, l'effet tunnel??? ;°)
Franky,18:37 GMT+1 >> j'ai des circonstance atténuantes !!! :-ppp
Déjà !!! :-P
(d'ailleurs, Francky, +1 pour ta méthode. Ceci dis, juste une chose : je ne pense pas que calculer la surface soit un pb, il suffit de passer la base de test une fois pour chaque "couple de poids variable".
En une nuit de simu, si t'as pas une courbe à plusieurs minima, engueule ta copine, Mat')
Que des choses intelligentes disais-je, donc je trolle :
Mat >> de très belles surfaces qui représentent des puits de potentiel
T'as fait trop de physique quantique, toi.. T'as réussi, l'effet tunnel??? ;°)
Franky,18:37 GMT+1 >> j'ai des circonstance atténuantes !!! :-ppp
Déjà !!! :-P
franky*
Messages postés
165
Date d'inscription
mardi 7 décembre 2004
Statut
Membre
Dernière intervention
4 décembre 2008
5
2 avril 2005 à 12:02
2 avril 2005 à 12:02
En une nuit de simu, si t'as pas une courbe à plusieurs minima, engueule ta copine, Mat')
Non, c'est le contraire ! Si il a pas de chance, tant mieux ! ;-)
Mais ça me paraît chaud de ne compter qu'avec la chance pour ça... Mieux vaut se demander comment faire a priori pour avoir plusieurs minima !
<Troll>
Déjà !!! :-P
Oui : j'ai un vieux pote qui est passé, et je l'avais pas vu depuis longtemps !!! C'était l'occasion de prendre l'apéro, non ?
</Troll>
Non, c'est le contraire ! Si il a pas de chance, tant mieux ! ;-)
Mais ça me paraît chaud de ne compter qu'avec la chance pour ça... Mieux vaut se demander comment faire a priori pour avoir plusieurs minima !
<Troll>
Déjà !!! :-P
Oui : j'ai un vieux pote qui est passé, et je l'avais pas vu depuis longtemps !!! C'était l'occasion de prendre l'apéro, non ?
</Troll>
matmdx
Messages postés
30
Date d'inscription
jeudi 10 avril 2003
Statut
Membre
Dernière intervention
2 avril 2005
34
2 avril 2005 à 13:12
2 avril 2005 à 13:12
>>> Tu n'as qu'à faire plusieurs essais avec des poids au hasard, tu finiras bien par tomber sur un cas avec 2 min
Mais c'est ce que j'ai fait !!! Et je n'ai jamais eu 2 minima !
>>> En une nuit de simu, si t'as pas une courbe à plusieurs minima, engueule ta copine, Mat')
lol ;-)
Mais c'est ce que j'ai fait !!! Et je n'ai jamais eu 2 minima !
>>> En une nuit de simu, si t'as pas une courbe à plusieurs minima, engueule ta copine, Mat')
lol ;-)
bonjour a tous;
je suis etudiante en 5 émé année ing en informatique je prépare mon logiciel dont le théme :" La fouille de données médical par les resux de neurone" plus exactement avec les cartes kohonen je ne sais pas d'ou je commence j'ai fait la codification en binaire ...
j'ai besoin de votre aide la plus tôt possible .
merçi Beaucoup
je suis etudiante en 5 émé année ing en informatique je prépare mon logiciel dont le théme :" La fouille de données médical par les resux de neurone" plus exactement avec les cartes kohonen je ne sais pas d'ou je commence j'ai fait la codification en binaire ...
j'ai besoin de votre aide la plus tôt possible .
merçi Beaucoup
franky*
Messages postés
165
Date d'inscription
mardi 7 décembre 2004
Statut
Membre
Dernière intervention
4 décembre 2008
5
15 avril 2005 à 23:42
15 avril 2005 à 23:42
Salut Biba,
Pour autant que je me souvienne, il y a une interface graphique (très mal faite, du moins sous Matlab 6.5, certes, mais bon, ils ont appelé ça une interface graphique...) très simple d'utilisation :
Pour l'ouvrir, tu tapes nntool dans la fenêtre de commande.
Ensuite, tu te laisse guider (de toutes façons, l'aide est très bien faite, si tu lis l'anglais...) ; en gros, tu importes tes données (jeux d'entraînement, etc) à l'aide du bouton "import" en te plaçant soit dans "imputs", soit dans "target" (tu peux aussi importer un réseau entier...), puis tu crées un réseau ("new network", évidemment). Une fois ton réseau créé, tu peux l'utiliser (double clic ou "view"), en modifiant l'onglet "train" (laisse tomber "simulate" et "adapt" pour l'instant).
Et hop ! C'est magique...
Pour autant que je me souvienne, il y a une interface graphique (très mal faite, du moins sous Matlab 6.5, certes, mais bon, ils ont appelé ça une interface graphique...) très simple d'utilisation :
Pour l'ouvrir, tu tapes nntool dans la fenêtre de commande.
Ensuite, tu te laisse guider (de toutes façons, l'aide est très bien faite, si tu lis l'anglais...) ; en gros, tu importes tes données (jeux d'entraînement, etc) à l'aide du bouton "import" en te plaçant soit dans "imputs", soit dans "target" (tu peux aussi importer un réseau entier...), puis tu crées un réseau ("new network", évidemment). Une fois ton réseau créé, tu peux l'utiliser (double clic ou "view"), en modifiant l'onglet "train" (laisse tomber "simulate" et "adapt" pour l'instant).
Et hop ! C'est magique...
salut a tous voila je suis etudiant mecanicien mais je dois faire un exposé sur les réseaux de neurone j'aurais besoin pour cela de doc bien faite et d'un petit exemple simple et bien fait pour l'expliquer lors de la soutenance si qq pouvait m'aider ca serait top merci d'avance...
salut
voila je suis mecanicien et je travail sur les RN actuelement sur l'algorithme de Kohonen pour trouver le chemin optimal etle plus cours dans un nuage de point (probleme de voyageur de comerce). le probleme c'est que j'arrive pas a trouver l'interpretation de l'algorithme pour le programmer sur matlab. si quelqu'un pourra m'aider a trouver la doc des cours de l'algorithme de kohonen et de l'application de ce dernier sur matlab je serai tres reconaissant surtout s'il existe des exemple detailes. merci d'avance et a +
voila je suis mecanicien et je travail sur les RN actuelement sur l'algorithme de Kohonen pour trouver le chemin optimal etle plus cours dans un nuage de point (probleme de voyageur de comerce). le probleme c'est que j'arrive pas a trouver l'interpretation de l'algorithme pour le programmer sur matlab. si quelqu'un pourra m'aider a trouver la doc des cours de l'algorithme de kohonen et de l'application de ce dernier sur matlab je serai tres reconaissant surtout s'il existe des exemple detailes. merci d'avance et a +
infotipe
Messages postés
2
Date d'inscription
lundi 12 décembre 2005
Statut
Membre
Dernière intervention
28 janvier 2006
28 janv. 2006 à 19:34
28 janv. 2006 à 19:34
bonjour xavier,
je voulais savoir s'il était possible que tu m'explique comment programmer un réseau de neurones car je dois programmer un programme de reconnaissance de caractères (sous CaML) et je ne sais pas du tout comment modéliser un réseau de neurones (tableau, matrices, quels arguments a-t-il ?) ou peut-être aurais-tu un site à me proposer. Je serai interessé aussi par un code dans n'importe quel language !!!!
Merci de ton aide.
je voulais savoir s'il était possible que tu m'explique comment programmer un réseau de neurones car je dois programmer un programme de reconnaissance de caractères (sous CaML) et je ne sais pas du tout comment modéliser un réseau de neurones (tableau, matrices, quels arguments a-t-il ?) ou peut-être aurais-tu un site à me proposer. Je serai interessé aussi par un code dans n'importe quel language !!!!
Merci de ton aide.
franky*
Messages postés
165
Date d'inscription
mardi 7 décembre 2004
Statut
Membre
Dernière intervention
4 décembre 2008
5
30 janv. 2006 à 08:47
30 janv. 2006 à 08:47
Salut,
Si c'est pour un TIPE et que tu dois faire ça en Caml, mieux vaut abandonner tout de suite ! A la rigueur en oCaml (langage objet), mais je ne pense pas que quelqu'un oserait tenter de programmer un RN sous Caml !
Déjà, faire de la reconnaissance de caractères pour un TIPE, ça me parait très chaud : peut-être qu'il faudrait envisager de revoir tes objectifs à la baisse, quitte à faire qqch de plus simple, mais plus réaliste et mieux. Programmer un RN, en sois, c'est déjà un gros boulot !
Bon courage !
Si c'est pour un TIPE et que tu dois faire ça en Caml, mieux vaut abandonner tout de suite ! A la rigueur en oCaml (langage objet), mais je ne pense pas que quelqu'un oserait tenter de programmer un RN sous Caml !
Déjà, faire de la reconnaissance de caractères pour un TIPE, ça me parait très chaud : peut-être qu'il faudrait envisager de revoir tes objectifs à la baisse, quitte à faire qqch de plus simple, mais plus réaliste et mieux. Programmer un RN, en sois, c'est déjà un gros boulot !
Bon courage !
beautchou
>
franky*
Messages postés
165
Date d'inscription
mardi 7 décembre 2004
Statut
Membre
Dernière intervention
4 décembre 2008
5 févr. 2006 à 19:51
5 févr. 2006 à 19:51
slr Franky,
avant tout, je te remercier pour tes remarques pertinentes et qui doivent etre prises en compte par les visiteurs (les utilisateurs des RN bien sur). sincèrement CHAPEAU, j'aime bien ta méthode de cummuniquer avec les gens, c'ets tres pédagogique.
je ne sais pas par koi commencer ! voilà en fait je travail sur les réseaux de neurones ( je suis débutant), je ne suis pas un informaticien mais ça touche a mon domaine (l'ingineering). mon travail consiste a exploiter cet outil math performant a l'ingenierie (mécanique). Bref, j'utilise les MLP, le thème de mon projet était un peu spécifique, je devais utiliser les réseaux dynamiques, parceque le processus que je dois modeliser (supervision en ligne) est un processus dynamique et completement aléatoires meme si on sait a peu pres l'allure générale de ce process. au fil du temps j'ai decouvert que 99% des travaux qui ont été fait dans ce domaines utilisent les MLP vu leurs simplicité et les résultats tres satisfaisants qu'ils donnent. alors j'ai opté pour ce type de réseau MLP + rétropropagation du gradient avec momentum . en plus des avantges cités de ce type dans ce domaine, j'ai trouvé pas mal de livres et d'articles qui qualifie ce réseau (MLP+Rétro+Momentum) comme étant un réseau dynamique, en se basant sur le fait que ce paramètre (Momentum) prends en compte l'influence de l'état précedent su l'état actuel du réseau. ce que je veux savoir Franky en premier lieu: est ce c'est vrai ???
j'ai commencé de faire de la prog en utilisant Matlab, j'ai eu des résultats. ça s'amiliore d'un jr a l'autre. ma stratégie est la suivante: j'utilise un MLP de trois couches ( couche d'entrée, cachée et de sortie), j'ai 6 entrées (vecteurs) et une seule sortie, j'ai fait varier le nbre de neurones dans la couche cachée ( de 1 a25) avec un taux d'apprentissage egale à 0.3 et un momentum égale à 0.5 ( choisi d'une manière arbitraire) afin de faire une optimisation sur l'architecture en faisant plusieurs essais pour chaque architecture( 5 essais pour différents valeurs de poids) ensuite je fais des tests pour prendre l'architecture qui donne un taux de réussite le plus élevé dans la base de test. une fois l'architecture est choisie, j'ai fait varire les deux paramètres (taux et momentum) avec un pas de 0.1 chacun, l'intevale pour chaque parmaètre étant de [0.1,0.9] ce qui fait donc 9*9=81 possibilités. ces derniers essais je les fait pour des valeurx de poids (initiaux) fixes, ie ceux qui me donnaient un taux de réussite élevé au début (optimisation de l'architecture). est ce que ça pose un problème si j'utilise les mêmes poids d'initialisation pour faire une optimisation sur ces facteurs ? ou bien je change la matrice de poids d'initialisation au fure et a mesure ?
autres alternatives: je pense a etudier l'influence du rapport taille de la base d'appr sur la taille de la base de tsts et voir l'impact ( appremment c'est un problème d'Overffiting comme tu l'as dit aupparevent). concernat ce phénomène c'ets la taille de la base d'appr qui l'engendre ou bien le nbre d'itération est l'erreur imposée (performance du réseau)?
j'espère bien que je n'étais LOURD a travers ce message, et j'espère bien trouver des réponses pour les questions que viens de poser. je compte sur toi Franky ainsi que toi Xavier j'apprecie bcp ce que tu donnes pour les utilisateurs de ce Forum ( au moins pour moi).
bne continuation.
l'amoureux de la progrmmation beautchou
avant tout, je te remercier pour tes remarques pertinentes et qui doivent etre prises en compte par les visiteurs (les utilisateurs des RN bien sur). sincèrement CHAPEAU, j'aime bien ta méthode de cummuniquer avec les gens, c'ets tres pédagogique.
je ne sais pas par koi commencer ! voilà en fait je travail sur les réseaux de neurones ( je suis débutant), je ne suis pas un informaticien mais ça touche a mon domaine (l'ingineering). mon travail consiste a exploiter cet outil math performant a l'ingenierie (mécanique). Bref, j'utilise les MLP, le thème de mon projet était un peu spécifique, je devais utiliser les réseaux dynamiques, parceque le processus que je dois modeliser (supervision en ligne) est un processus dynamique et completement aléatoires meme si on sait a peu pres l'allure générale de ce process. au fil du temps j'ai decouvert que 99% des travaux qui ont été fait dans ce domaines utilisent les MLP vu leurs simplicité et les résultats tres satisfaisants qu'ils donnent. alors j'ai opté pour ce type de réseau MLP + rétropropagation du gradient avec momentum . en plus des avantges cités de ce type dans ce domaine, j'ai trouvé pas mal de livres et d'articles qui qualifie ce réseau (MLP+Rétro+Momentum) comme étant un réseau dynamique, en se basant sur le fait que ce paramètre (Momentum) prends en compte l'influence de l'état précedent su l'état actuel du réseau. ce que je veux savoir Franky en premier lieu: est ce c'est vrai ???
j'ai commencé de faire de la prog en utilisant Matlab, j'ai eu des résultats. ça s'amiliore d'un jr a l'autre. ma stratégie est la suivante: j'utilise un MLP de trois couches ( couche d'entrée, cachée et de sortie), j'ai 6 entrées (vecteurs) et une seule sortie, j'ai fait varier le nbre de neurones dans la couche cachée ( de 1 a25) avec un taux d'apprentissage egale à 0.3 et un momentum égale à 0.5 ( choisi d'une manière arbitraire) afin de faire une optimisation sur l'architecture en faisant plusieurs essais pour chaque architecture( 5 essais pour différents valeurs de poids) ensuite je fais des tests pour prendre l'architecture qui donne un taux de réussite le plus élevé dans la base de test. une fois l'architecture est choisie, j'ai fait varire les deux paramètres (taux et momentum) avec un pas de 0.1 chacun, l'intevale pour chaque parmaètre étant de [0.1,0.9] ce qui fait donc 9*9=81 possibilités. ces derniers essais je les fait pour des valeurx de poids (initiaux) fixes, ie ceux qui me donnaient un taux de réussite élevé au début (optimisation de l'architecture). est ce que ça pose un problème si j'utilise les mêmes poids d'initialisation pour faire une optimisation sur ces facteurs ? ou bien je change la matrice de poids d'initialisation au fure et a mesure ?
autres alternatives: je pense a etudier l'influence du rapport taille de la base d'appr sur la taille de la base de tsts et voir l'impact ( appremment c'est un problème d'Overffiting comme tu l'as dit aupparevent). concernat ce phénomène c'ets la taille de la base d'appr qui l'engendre ou bien le nbre d'itération est l'erreur imposée (performance du réseau)?
j'espère bien que je n'étais LOURD a travers ce message, et j'espère bien trouver des réponses pour les questions que viens de poser. je compte sur toi Franky ainsi que toi Xavier j'apprecie bcp ce que tu donnes pour les utilisateurs de ce Forum ( au moins pour moi).
bne continuation.
l'amoureux de la progrmmation beautchou
franky*
Messages postés
165
Date d'inscription
mardi 7 décembre 2004
Statut
Membre
Dernière intervention
4 décembre 2008
5
>
beautchou
6 févr. 2006 à 12:03
6 févr. 2006 à 12:03
Salut Beautchou,
Merci pour le compliment :-)
Je dois remettre qqch au point : je ne suis pas un spécialiste des réseaus de neurones ! Mais alors pas du tout ! Je suis presque désolé de voir que tu as tellement écrit, alors que je ne comprends pas la moitié de ce que tu écris...
Je vais faire de mon mieux pour répondre :
Quand tu parles de processus aléatoire, je pense d'abord à un MDP (processus de décision markovien) qu'à un MLP ! Si tu n'étais pas déjà si avancé sur les réseaux de neurones, je t'aurais conseillé d'aller chercher dans cette voie...
Je ne sais plus exactement ce qu'est le momentum, mais il me semble simplement que ça signifie que chaque valeur d'entrée passe successivement dans chaque point d'entrée, autrement dit, la couche d'entrée, de taille n, contient les n dernières valeurs du jeu de données. Donc si c'est ça, ça prend bien en compte tous les états précédents au temps t (jusqu'à t-n). De toutes façons, si j'ai appris ça, c'est dans l'aide de matlab...
Ensuite, tu as l'air de bien te débrouiller avec tes expériences.
Je ne suis pas sûr de comprendre ta question : tu te demandes s'il faut que tu changes les valeurs initiales pour chaque expérience, ou s'il faut que tu gardes les mêmes pour pouvoir comparer ces xp, c'est bien ça ?
Si c'est le cas, la seule réponse que je peux te donner, c'est de vérifier si les valeurs initiales influent sur le résultat : il faut dans ce cas faire plusieurs xp avec les mêmes paramètres mais en changeant les valeurs initiales (on appelle ça une réplication, dans la méthode expériementale).
Pour finir, à propos des bases d'entrainement et de test, j'ai trouvé un site avec une thèse complète très bien expliquée : tu n'est pas obligé de tout lire bien sûr, mais le début me sembles très intéressant !
J'espère que tu t'en sortiras avec ça...
Merci pour le compliment :-)
Je dois remettre qqch au point : je ne suis pas un spécialiste des réseaus de neurones ! Mais alors pas du tout ! Je suis presque désolé de voir que tu as tellement écrit, alors que je ne comprends pas la moitié de ce que tu écris...
Je vais faire de mon mieux pour répondre :
Quand tu parles de processus aléatoire, je pense d'abord à un MDP (processus de décision markovien) qu'à un MLP ! Si tu n'étais pas déjà si avancé sur les réseaux de neurones, je t'aurais conseillé d'aller chercher dans cette voie...
Je ne sais plus exactement ce qu'est le momentum, mais il me semble simplement que ça signifie que chaque valeur d'entrée passe successivement dans chaque point d'entrée, autrement dit, la couche d'entrée, de taille n, contient les n dernières valeurs du jeu de données. Donc si c'est ça, ça prend bien en compte tous les états précédents au temps t (jusqu'à t-n). De toutes façons, si j'ai appris ça, c'est dans l'aide de matlab...
Ensuite, tu as l'air de bien te débrouiller avec tes expériences.
Je ne suis pas sûr de comprendre ta question : tu te demandes s'il faut que tu changes les valeurs initiales pour chaque expérience, ou s'il faut que tu gardes les mêmes pour pouvoir comparer ces xp, c'est bien ça ?
Si c'est le cas, la seule réponse que je peux te donner, c'est de vérifier si les valeurs initiales influent sur le résultat : il faut dans ce cas faire plusieurs xp avec les mêmes paramètres mais en changeant les valeurs initiales (on appelle ça une réplication, dans la méthode expériementale).
Pour finir, à propos des bases d'entrainement et de test, j'ai trouvé un site avec une thèse complète très bien expliquée : tu n'est pas obligé de tout lire bien sûr, mais le début me sembles très intéressant !
http://www.becoz.org/these/memoirehtml/ch06.html
J'espère que tu t'en sortiras avec ça...
Beautchou
>
franky*
Messages postés
165
Date d'inscription
mardi 7 décembre 2004
Statut
Membre
Dernière intervention
4 décembre 2008
9 févr. 2006 à 20:33
9 févr. 2006 à 20:33
slt Franky,
Merci pour la réponse et dsl pour le retard.
Bon, a propos du momentum voilà la relation qui l'utilise pour l'adaptation des poids et des biais:
w(nouv)=w(ancien)+Δw
avec :
Δw(I)=α*(ΔE/Δw)+ηΔw(I-1).
α: taux d'apprentissage.
le cofacteur de α est la dérivée de l'erreur (E=O(sortie)-T(cible)) par rapport aux poids wij.
η: momentum.
donc tu remarques que variations des poids de l'itération (I) sont calculés en prenant compte les variations de poids de l'itération (I-1) c'est a dire l'étape précédente.
d'aprés ce que j'ai trouvé, ce terme de momentum pemet de compenser les problèmes rencontrés avec un taux d'apprentissage élevé ou petit ( sacanht qu'avec un taux d'app élevé engendre une perte en pércision et un petit taux d'app donne naissancea des oscillations parasites).
en tout moi je travaille avec et je vois son influence disons positve sur le réseau. a vrai dire c'est cassement de tate avec tous ces facteurs c'ets un peu défficile de trouver le réseau qyui convient pour une application donée.
j'ai limité la precision (goal) a 0.0025 et le nbre d'itérations a 20000 afin déviter le pb de sur-apprentissage (même avec une erreur de 0.002 j'ai eu des résultats mais ça me coute trop en terme de temps vu le nombre élevé d'experience).
au tyotal j'ai 57 exemples j'ai choisi 44 pour l'apprentissage et 13 pour le teste en premier lieu.
je commence a voir l'inluence du taux d'appr et du momentum sur la fiablité et le taux de réussite du réseau, apres je tenterai de voir l'inluence de la taille des deux ensembles (appr et test), ensuite l'inluence des pids initiaux et des fontions de transfert...il me reste du boulot !!!
qu'en dis tu ?
j'attends tjs des critiques avec gd coeur,je t'informerai s'il y aura du nouveau.
bne suite.
1-de donner un aspect dynamique au processus d'apprentissage en introduisant l'inluence des étapes précédentes sur les étapes actuelles.
2-d'éviter de tomber sur un minimum local (local minima) et de trouver tjs un minimum global.
3-ce facteur variant entre 0 et 1 permet
Merci pour la réponse et dsl pour le retard.
Bon, a propos du momentum voilà la relation qui l'utilise pour l'adaptation des poids et des biais:
w(nouv)=w(ancien)+Δw
avec :
Δw(I)=α*(ΔE/Δw)+ηΔw(I-1).
α: taux d'apprentissage.
le cofacteur de α est la dérivée de l'erreur (E=O(sortie)-T(cible)) par rapport aux poids wij.
η: momentum.
donc tu remarques que variations des poids de l'itération (I) sont calculés en prenant compte les variations de poids de l'itération (I-1) c'est a dire l'étape précédente.
d'aprés ce que j'ai trouvé, ce terme de momentum pemet de compenser les problèmes rencontrés avec un taux d'apprentissage élevé ou petit ( sacanht qu'avec un taux d'app élevé engendre une perte en pércision et un petit taux d'app donne naissancea des oscillations parasites).
en tout moi je travaille avec et je vois son influence disons positve sur le réseau. a vrai dire c'est cassement de tate avec tous ces facteurs c'ets un peu défficile de trouver le réseau qyui convient pour une application donée.
j'ai limité la precision (goal) a 0.0025 et le nbre d'itérations a 20000 afin déviter le pb de sur-apprentissage (même avec une erreur de 0.002 j'ai eu des résultats mais ça me coute trop en terme de temps vu le nombre élevé d'experience).
au tyotal j'ai 57 exemples j'ai choisi 44 pour l'apprentissage et 13 pour le teste en premier lieu.
je commence a voir l'inluence du taux d'appr et du momentum sur la fiablité et le taux de réussite du réseau, apres je tenterai de voir l'inluence de la taille des deux ensembles (appr et test), ensuite l'inluence des pids initiaux et des fontions de transfert...il me reste du boulot !!!
qu'en dis tu ?
j'attends tjs des critiques avec gd coeur,je t'informerai s'il y aura du nouveau.
bne suite.
1-de donner un aspect dynamique au processus d'apprentissage en introduisant l'inluence des étapes précédentes sur les étapes actuelles.
2-d'éviter de tomber sur un minimum local (local minima) et de trouver tjs un minimum global.
3-ce facteur variant entre 0 et 1 permet
Beautchou
>
franky*
Messages postés
165
Date d'inscription
mardi 7 décembre 2004
Statut
Membre
Dernière intervention
4 décembre 2008
10 févr. 2006 à 17:28
10 févr. 2006 à 17:28
slt Franky,
(je ne sais ce que s'est arrivé a mon message le voilà je lui ai redonné sa première version)
Merci pour la réponse et dsl pour le retard.
Bon, a propos du momentum voilà la relation qui l'utilise pour l'adaptation des poids et des biais:
w(nouv)=w(ancien)+Δw
avec :
Δw(I)=α*(ΔE/Δw)+ηΔw(I-1).
α: taux d'apprentissage.
le cofacteur de α est la dérivée de l'erreur (E=O(sortie)-T(cible)) par rapport aux poids wij.
η: momentum.
donc tu remarques que variations des poids de l'itération (I) sont calculés en prenant compte les variations de poids de l'itération (I-1) c'est a dire l'étape précédente.
d'aprés ce que j'ai trouvé, ce terme de momentum pemet de :
1-de donner un aspect dynamique au processus d'apprentissage en introduisant l'inluence des étapes précédentes sur les étapes actuelles.
2-d'éviter de tomber sur un minimum local (local minima) et de trouver tjs un minimum global.
3-ce facteur variant entre 0 et 1 permet de compenser les problèmes rencontrés avec un taux d'apprentissage élevé ou petit ( sachant qu'avec un taux d'app élevé engendre une perte en pércision et un petit taux d'app donne naissance a des oscillations parasites).
en tout cas moi je travaille avec et je vois son influence disons positve sur le réseau. a vrai dire c'est un cassement de tête avec tous ces facteurs c'est un peu défficile de trouver le réseau qui convient pour une application donée.
j'ai limité la precision (goal) a 0.0025 et le nbre d'itérations a 20000 afin déviter le pb de sur-apprentissage (même avec une erreur de 0.002 j'ai eu des résultats mais ça me coute trop en terme de temps vu le nombre élevé d'experience).
au tyotal j'ai 57 exemples j'ai choisi 44 pour l'apprentissage et 13 pour le teste en premier lieu.
je commence a voir l'inluence du taux d'appr et du momentum sur la fiablité et le taux de réussite du réseau, apres je tenterai de voir l'inluence de la taille des deux ensembles (appr et test), ensuite l'inluence des pids initiaux et des fontions de transfert...il me reste du boulot !!!
qu'en dis tu ?
j'attends tjs des critiques avec gd coeur,je t'informerai s'il y aura du nouveau.
bne suite.
(je ne sais ce que s'est arrivé a mon message le voilà je lui ai redonné sa première version)
Merci pour la réponse et dsl pour le retard.
Bon, a propos du momentum voilà la relation qui l'utilise pour l'adaptation des poids et des biais:
w(nouv)=w(ancien)+Δw
avec :
Δw(I)=α*(ΔE/Δw)+ηΔw(I-1).
α: taux d'apprentissage.
le cofacteur de α est la dérivée de l'erreur (E=O(sortie)-T(cible)) par rapport aux poids wij.
η: momentum.
donc tu remarques que variations des poids de l'itération (I) sont calculés en prenant compte les variations de poids de l'itération (I-1) c'est a dire l'étape précédente.
d'aprés ce que j'ai trouvé, ce terme de momentum pemet de :
1-de donner un aspect dynamique au processus d'apprentissage en introduisant l'inluence des étapes précédentes sur les étapes actuelles.
2-d'éviter de tomber sur un minimum local (local minima) et de trouver tjs un minimum global.
3-ce facteur variant entre 0 et 1 permet de compenser les problèmes rencontrés avec un taux d'apprentissage élevé ou petit ( sachant qu'avec un taux d'app élevé engendre une perte en pércision et un petit taux d'app donne naissance a des oscillations parasites).
en tout cas moi je travaille avec et je vois son influence disons positve sur le réseau. a vrai dire c'est un cassement de tête avec tous ces facteurs c'est un peu défficile de trouver le réseau qui convient pour une application donée.
j'ai limité la precision (goal) a 0.0025 et le nbre d'itérations a 20000 afin déviter le pb de sur-apprentissage (même avec une erreur de 0.002 j'ai eu des résultats mais ça me coute trop en terme de temps vu le nombre élevé d'experience).
au tyotal j'ai 57 exemples j'ai choisi 44 pour l'apprentissage et 13 pour le teste en premier lieu.
je commence a voir l'inluence du taux d'appr et du momentum sur la fiablité et le taux de réussite du réseau, apres je tenterai de voir l'inluence de la taille des deux ensembles (appr et test), ensuite l'inluence des pids initiaux et des fontions de transfert...il me reste du boulot !!!
qu'en dis tu ?
j'attends tjs des critiques avec gd coeur,je t'informerai s'il y aura du nouveau.
bne suite.
salut xavier ,
si tu as le logiciel" Matlab" tu peux voir une section qui s'appelle "neuronal toolbox" dans laquelle tu peux trouver plusieurs exemple de réseaus de neuronnes ainsi que des schémas. nb: tu peux aussi créer des réseaux de neurones avec "Matlab" .
si tu as le logiciel" Matlab" tu peux voir une section qui s'appelle "neuronal toolbox" dans laquelle tu peux trouver plusieurs exemple de réseaus de neuronnes ainsi que des schémas. nb: tu peux aussi créer des réseaux de neurones avec "Matlab" .
Bonjour
J'ai programmé un PMC chez moi
(1 couche d'entree, 1 couche cachée et une couche de sortie)
Il fonctionne assez bien pour des choses simples (+ - / x)
Mais je crois que je fais une erreur dans le concepte
Dites moi si je me trompe:
Le nombre d'entrée d'un neurone d'entrée est égale à la grille (8*8)
Si je dois reconnaitre 4 caractères, j'ai 4 neurones de sortie
La liaison entre couche entrée et caché est complete
La liaison entre couche cachée et sortie est complete
Ma fonction pour chaque neurone est 1/(1+(e(-x))
Et biensure une derniere chose, ma grille de 8x8 est constitué de 0 et de 1, mais voulant coder les niveaux de gris, j'ai commencé par passer par une valeur variant de 0 à 1. Et la, les resultats sont bisares. Normal ?
Comment on determine le nombre de neurone de la couche d'entrée? c'est 8 * 8 ??
Merci bcp pour ce forum, c'est tres interessant
J'ai programmé un PMC chez moi
(1 couche d'entree, 1 couche cachée et une couche de sortie)
Il fonctionne assez bien pour des choses simples (+ - / x)
Mais je crois que je fais une erreur dans le concepte
Dites moi si je me trompe:
Le nombre d'entrée d'un neurone d'entrée est égale à la grille (8*8)
Si je dois reconnaitre 4 caractères, j'ai 4 neurones de sortie
La liaison entre couche entrée et caché est complete
La liaison entre couche cachée et sortie est complete
Ma fonction pour chaque neurone est 1/(1+(e(-x))
Et biensure une derniere chose, ma grille de 8x8 est constitué de 0 et de 1, mais voulant coder les niveaux de gris, j'ai commencé par passer par une valeur variant de 0 à 1. Et la, les resultats sont bisares. Normal ?
Comment on determine le nombre de neurone de la couche d'entrée? c'est 8 * 8 ??
Merci bcp pour ce forum, c'est tres interessant
Bonjour,
j'aimerais utiliser un reseau de neurones pour apparier un modèle 3d à une image 2d. Plus clairement, je veux à partir de l'image d'un oeil connaitre la direction du regard en utilisant une modelisation 3d de la courbure de l'oeil et de l'iris (l'axe de la portion de sphere donne la direction).
Je voudrais que le reseau de neurone donne la position du modèle 3d collant le plus à l'image de l'oeil.
Je pensais utiliser un reseau de neurone car le calcul doit être rapide (la phase d'apprentissage pouvant etre longue) dans l'utilisation que je veux en faire (une detection de la position du regard sur un ecran)
Quel type de reseau utiliser ?
Pour les entrées je dois prendre la similitude entre le modèle 3d et l'image 2d ou chaque pixel de l'image 2d ?
Merci d'avance
j'aimerais utiliser un reseau de neurones pour apparier un modèle 3d à une image 2d. Plus clairement, je veux à partir de l'image d'un oeil connaitre la direction du regard en utilisant une modelisation 3d de la courbure de l'oeil et de l'iris (l'axe de la portion de sphere donne la direction).
Je voudrais que le reseau de neurone donne la position du modèle 3d collant le plus à l'image de l'oeil.
Je pensais utiliser un reseau de neurone car le calcul doit être rapide (la phase d'apprentissage pouvant etre longue) dans l'utilisation que je veux en faire (une detection de la position du regard sur un ecran)
Quel type de reseau utiliser ?
Pour les entrées je dois prendre la similitude entre le modèle 3d et l'image 2d ou chaque pixel de l'image 2d ?
Merci d'avance
bonour à tous!
je dois écrire des algorithmes qui, à partir d'un flux vidéo, détectent un passant, distinguent si c est une fille ou un garcon.
je dois programmer en c/c++ ou matlab ;j ai envie de les tester sur un réseau de neurones ou encore sur des DSP ou des FPGA mais je ne sais pas par où commencer.
si l'un d'entre vous peut m aider en me donnant les différentes étapes et ce qu il faut faire ca m'aiderai
ps: c est pour un stage
Merci d'avance
je dois écrire des algorithmes qui, à partir d'un flux vidéo, détectent un passant, distinguent si c est une fille ou un garcon.
je dois programmer en c/c++ ou matlab ;j ai envie de les tester sur un réseau de neurones ou encore sur des DSP ou des FPGA mais je ne sais pas par où commencer.
si l'un d'entre vous peut m aider en me donnant les différentes étapes et ce qu il faut faire ca m'aiderai
ps: c est pour un stage
Merci d'avance
salut j'i connais rien suis un con mais je pense pouvoir t'aide avec ce site bon conrage
http://maths.insa-lyon.fr/~balac/matlab/table.html
bon je risque de reste con mais bon c'est la vie @++
http://maths.insa-lyon.fr/~balac/matlab/table.html
bon je risque de reste con mais bon c'est la vie @++
Bonjour à tous...
Qui connait bien le "nntool" de matlab? comment importer des données d'entrées aux réseaux à partir du workspace ou à partir d'un fichier .mat? Doit-on rentrer l'algorithme des données d'entrées? Je suis pas informaticien, ni automaticien, je suis en genie electrique et j'ai besoin des reseaux de neurones pour simuler une commande predictive de température dans un bâtiment.
Pour ceux qui connaissent un peu le domaine, si je veux modéliser un bâtiment à plusieurs entrées (rayonnemnent solaire, occupants....) et à une sortie (temperature interne) à partir d'un reseau de neurones. Les données d'entrées (servant de base d'exemples) à importer, ce serait l'equation de convection regissant entre differents elements du batiment?
Merci d'avance....
Qui connait bien le "nntool" de matlab? comment importer des données d'entrées aux réseaux à partir du workspace ou à partir d'un fichier .mat? Doit-on rentrer l'algorithme des données d'entrées? Je suis pas informaticien, ni automaticien, je suis en genie electrique et j'ai besoin des reseaux de neurones pour simuler une commande predictive de température dans un bâtiment.
Pour ceux qui connaissent un peu le domaine, si je veux modéliser un bâtiment à plusieurs entrées (rayonnemnent solaire, occupants....) et à une sortie (temperature interne) à partir d'un reseau de neurones. Les données d'entrées (servant de base d'exemples) à importer, ce serait l'equation de convection regissant entre differents elements du batiment?
Merci d'avance....
Bonjour,
Je cherche à programmer une équipe de foot pour la RoboCup (simulation), en utilisant un réseau de neuronnes pour l'apprentissage des différents paramètres (force de frappe, direction, vent, comportement des adversaires, ...).
Mon choix s'est porté sur les perceptrons multi couches (c'est ce qui a l'air le plus simple) mais malgré de nombreuses lectures, je ne suis toujours pas certain que ce soit la bonne solution, et l'étude des alternatives (trop nombreuses) est vraiment fastidieuse.
Serait-il possible d'avoir un avis là-dessus ?
J'ai également lu des choses sur le Q-learning. Serait-ce une bonne alternative ? Serait-ce possible de combiner les 2 ?
Merci d'avance.
Alexandre.
Je cherche à programmer une équipe de foot pour la RoboCup (simulation), en utilisant un réseau de neuronnes pour l'apprentissage des différents paramètres (force de frappe, direction, vent, comportement des adversaires, ...).
Mon choix s'est porté sur les perceptrons multi couches (c'est ce qui a l'air le plus simple) mais malgré de nombreuses lectures, je ne suis toujours pas certain que ce soit la bonne solution, et l'étude des alternatives (trop nombreuses) est vraiment fastidieuse.
Serait-il possible d'avoir un avis là-dessus ?
J'ai également lu des choses sur le Q-learning. Serait-ce une bonne alternative ? Serait-ce possible de combiner les 2 ?
Merci d'avance.
Alexandre.