Séparer les données (train, test) : même valeur même groupe

Résolu/Fermé
Fancq - Modifié le 23 mars 2022 à 18:01
yg_be Messages postés 23232 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 28 septembre 2024 - 23 mars 2022 à 18:47
Bonjour,
je souhaiterais savoir s'il existe un moyen de séparer des données en deux (train et test), mais avec une petite subtilité. C'est a dire qu'on a dans nos données une variable ID ( plusieurs lignes peuvent avoir le même id), lorsqu'une ligne avec un id = 3 par exemple a été mise dans le train alors toutes les lignes ayant cet id doivent être dans le train.
Il faut aussi avoir 70% des données dans le train et 30 dans le test.

Exemple:
list= [1,2,3,1,2,3,4]
list1=[1,1,2,2,4]
list2=[3,3]

Merci d'avance pour toute aide
A voir également:

1 réponse

yg_be Messages postés 23232 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 28 septembre 2024 Ambassadeur 1 538
23 mars 2022 à 18:41
bonjour,
quel est le lien entre l'exemple et l'explication?
sur quelle partie de l'exercice rencontres-tu des difficultés?
0
yg_be Messages postés 23232 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 28 septembre 2024 1 538
23 mars 2022 à 18:47
Je pense qu'il s'agit d'un exemple d'optimisation discrète, tu peux en apprendre plus en faisant une recherche "optimisation discrète".
Tu peux facilement transformer ton exercice en un exercice de sac à dos: https://fr.wikipedia.org/wiki/Probl%C3%A8me_du_sac_%C3%A0_dos
0