Prétraitement d'une base de données (Machine Learning)

Fermé
nastassia_ Messages postés 7 Date d'inscription mardi 25 juillet 2017 Statut Membre Dernière intervention 3 août 2017 - 25 juil. 2017 à 22:12
nastassia_ Messages postés 7 Date d'inscription mardi 25 juillet 2017 Statut Membre Dernière intervention 3 août 2017 - 3 août 2017 à 14:59
Bonjour,

Je suis en cours de développement d’un système de vision par ordinateur en utilisant matlab.

Chaque entrée (observation) de ma base donnée est une matrice de 6 colonnes et le nombre des lignes est variable.
Les 6 colonnes correspondent aux caractéristiques "features"

Malheureusement, je sais bien que ma base de données ne peut pas être exploitée directement au machine learning.

Je suis habituée à traiter des images, pas des données numériques sous formes des matrices.
Même si les images sont des matrices.
Je crois que ce n’est pas possible d’utiliser les mêmes méthodes du traitement d’images.

Est-ce que vous pouvez me proposer une idée de prétraitement de ces données ?
Je vous remercie par avance.
A voir également:

1 réponse

totodunet Messages postés 1377 Date d'inscription mercredi 18 mars 2009 Statut Membre Dernière intervention 5 mars 2020 199
28 juil. 2017 à 11:12
Salut!

Malheureusement, je sais bien que ma base de données ne peut pas être exploitée directement au machine learning.

Pourquoi ?
1
nastassia_ Messages postés 7 Date d'inscription mardi 25 juillet 2017 Statut Membre Dernière intervention 3 août 2017
28 juil. 2017 à 16:52
Salut !

Chaque entrée doit être modélisée dans un vecteur! non?
J'ai des matrices comme des entrées
0
totodunet Messages postés 1377 Date d'inscription mercredi 18 mars 2009 Statut Membre Dernière intervention 5 mars 2020 199
Modifié le 29 juil. 2017 à 00:58
ça dépend. Quel est l'objectif du projet ? C'est de la reconnaissance d'objets à travers une image j'imagine... Quel est l'algorithme utilisé ?
0
nastassia_ Messages postés 7 Date d'inscription mardi 25 juillet 2017 Statut Membre Dernière intervention 3 août 2017 > totodunet Messages postés 1377 Date d'inscription mercredi 18 mars 2009 Statut Membre Dernière intervention 5 mars 2020
31 juil. 2017 à 17:40
Je crois que je n'ai pas bien expliqué le problème.

En fait, je ne traite pas des images.
L'objectif de mon projet est d'appliquer l'apprentissage supervisé à l'aide de deep learning de 1500 structures cristallines.
Chaque structure cristalline est modélisée par une matrice.
Donc j'ai 1500 matrices comme entrées de dimensions variables (nombre de colonnes de chaque matrice égale à 6 or le nombre des lignes dépend du structure cristalline).

Le problème que je ne sais pas comment présenter ces matrices comme entrées au machine learning.

Faut t-il,par exemple, convertir chaque matrice en un vecteur ? et concaténer tous les vecteurs obtenus après?
0
totodunet Messages postés 1377 Date d'inscription mercredi 18 mars 2009 Statut Membre Dernière intervention 5 mars 2020 199
1 août 2017 à 11:53
Il faut se poser la question sur comme la machine va apprendre les modèles des structures cristallines. L'idée c'est d'avoir quoi en sortie ?

Les 1500 structures constituent sa base de connaissance donc. Une fois qu'il a appris cela, tu lui donne quoi en entrée (une structure cristalline j'imagine) pour qu'il te réponde quoi en sortie ? C'est un classifieur ?
0
nastassia_ Messages postés 7 Date d'inscription mardi 25 juillet 2017 Statut Membre Dernière intervention 3 août 2017 > totodunet Messages postés 1377 Date d'inscription mercredi 18 mars 2009 Statut Membre Dernière intervention 5 mars 2020
1 août 2017 à 13:08
Si je modélise les matrices d'entrées (les structures cristallines) par des "X" et on les adjoindre à des sorties "Y" (labels des structures cristallines).

Après la phase d'apprentissage, le but final du projet est de découvrir (générer) des nouvelles structures cristallines "X" qui n'existent pas dans la base de données pour chaque "Y".

Base de données --> Apprentissage de base de donnée --> Machine learning model --> générer des nouvelles données synthétiques.
0