Features selection et features reduction

Signaler
Messages postés
6
Date d'inscription
mardi 27 février 2018
Statut
Membre
Dernière intervention
1 septembre 2020
-
 carol103 -
J'ai un gros dataset avec plus de 130 features (des colonnes), mon objectif c'est d'utiliser ce dataset dans un algorithme de machine learning comme les réseaux de neurones. Parmi les 130 features, il y a certainement des features qui n'apportent pas de l'information ou qui n'auront pas de l'importance dans mon algorithme de ML.

J'ai entendu parler des features selection, des features reductions, de l'ACP, de l'utilisation de weka pour classifier les features selon un rank mais je suis un peu perdu entre tous ça.
J'ai besoin de vos conseils pour aller rapidement mais sûrement dans mon étude car la réduction ou la sélection des features n'est qu'une étape de mon étude.
Merci d'avance.

2 réponses

Tu pourrais donner quelques exemples de tes "features"
Et des critères de pertinence.
Parce présenté comme ça, c'est le pot au noir.
Messages postés
6
Date d'inscription
mardi 27 février 2018
Statut
Membre
Dernière intervention
1 septembre 2020

En fait mes features sont extraites d'un trafic réseau. On y trouve l'@ ip, le RTT, le TTL en moyen et écart type, le nombre des paquets retransmis, le nombre des paquets dupliqués, des compteurs des flags SYN, ACK, FIN... la taille d'une fenêtre....ce genre de features.
130 colonnes ça donne une entité par ligne, c'est gérable.
Reste à connaître les critères de pertinence
Et le but à atteindre.