Features selection et features reduction

Fermé
Utilisateur anonyme - 31 août 2020 à 19:12
 carol103 - 5 sept. 2020 à 17:08
J'ai un gros dataset avec plus de 130 features (des colonnes), mon objectif c'est d'utiliser ce dataset dans un algorithme de machine learning comme les réseaux de neurones. Parmi les 130 features, il y a certainement des features qui n'apportent pas de l'information ou qui n'auront pas de l'importance dans mon algorithme de ML.

J'ai entendu parler des features selection, des features reductions, de l'ACP, de l'utilisation de weka pour classifier les features selon un rank mais je suis un peu perdu entre tous ça.
J'ai besoin de vos conseils pour aller rapidement mais sûrement dans mon étude car la réduction ou la sélection des features n'est qu'une étape de mon étude.
Merci d'avance.

2 réponses

Tu pourrais donner quelques exemples de tes "features"
Et des critères de pertinence.
Parce présenté comme ça, c'est le pot au noir.
0
Utilisateur anonyme
1 sept. 2020 à 10:31
En fait mes features sont extraites d'un trafic réseau. On y trouve l'@ ip, le RTT, le TTL en moyen et écart type, le nombre des paquets retransmis, le nombre des paquets dupliqués, des compteurs des flags SYN, ACK, FIN... la taille d'une fenêtre....ce genre de features.
0
130 colonnes ça donne une entité par ligne, c'est gérable.
Reste à connaître les critères de pertinence
Et le but à atteindre.
0