Séparer les données (train, test) : même valeur même groupe

Résolu
Fancq -  
yg_be Messages postés 23541 Date d'inscription   Statut Contributeur Dernière intervention   -
Bonjour,
je souhaiterais savoir s'il existe un moyen de séparer des données en deux (train et test), mais avec une petite subtilité. C'est a dire qu'on a dans nos données une variable ID ( plusieurs lignes peuvent avoir le même id), lorsqu'une ligne avec un id = 3 par exemple a été mise dans le train alors toutes les lignes ayant cet id doivent être dans le train.
Il faut aussi avoir 70% des données dans le train et 30 dans le test.

Exemple:
list= [1,2,3,1,2,3,4]
list1=[1,1,2,2,4]
list2=[3,3]

Merci d'avance pour toute aide
A voir également:

1 réponse

yg_be Messages postés 23541 Date d'inscription   Statut Contributeur Dernière intervention   Ambassadeur 1 584
 
bonjour,
quel est le lien entre l'exemple et l'explication?
sur quelle partie de l'exercice rencontres-tu des difficultés?
0
yg_be Messages postés 23541 Date d'inscription   Statut Contributeur Dernière intervention   1 584
 
Je pense qu'il s'agit d'un exemple d'optimisation discrète, tu peux en apprendre plus en faisant une recherche "optimisation discrète".
Tu peux facilement transformer ton exercice en un exercice de sac à dos: https://fr.wikipedia.org/wiki/Probl%C3%A8me_du_sac_%C3%A0_dos
0