Supprimer les doublons mais garder leurs infos

Fermé
girafette18 Messages postés 5 Date d'inscription mardi 1 janvier 2013 Statut Membre Dernière intervention 2 janvier 2013 - 1 janv. 2013 à 16:39
Tessel75 Messages postés 192 Date d'inscription lundi 17 décembre 2012 Statut Membre Dernière intervention 19 janvier 2013 - 11 janv. 2013 à 00:15
Bonjour,

J'aurais besoin d'aide concernant la réduction de 4 fichiers Excel (une liste de noms - prénoms - adresses - intérêts) en un seul.

Chaque fichier est similaire, car certains noms sont identiques (la plupart même). Toutefois, chaque fichier appartient à une catégorie particulière, et je n'aimerais pas perdre cette information une fois que la réduction est faite !

Exemple :

Fichier 1 - art
Claire Dubois
Marie Dupont
Sarah Owen

Fichier 2 - horlogerie
Claire Dubois
Elisabeth Duparc
Sonia Tambour

Fichier 3 - cinéma
Marie Dupont
Sarah Owen
Marc Bally

Fichier 4 - automobile
Claire Dubois
Marc Bally
Jennifer Best

J'aimerais que chaque contact n'apparaisse qu'une seule fois, mais que je puisse retrouver à quelle catégorie il appartient.

Résultat :

Claire Dubois - art - horlogerie - automobile
Marie Dupont - art - cinéma
Sarah Owen - art - cinéma
Elisabeth Duparc - horlogerie
Sonia Tambour - horlogerie
Marc Bally - cinéma - automobile
Jennifer Best - automobile

Je précise que j'aurais besoin de réduite les doublons sur les noms ET prénoms, car il y a énormément de personnes dans ces fichiers, et certaines portent le même nom de famille mais pas le même prénom.

Un GRAND merci d'avance de votre précieuse aide !

(j'ai commencé à faire du bricolage, en associant chaque possibilité, mais ça prend un temps fou et je m'emmêle les pinceaux... s'il existe une formule je suis preneuse!!)






A voir également:

17 réponses

Tessel75 Messages postés 192 Date d'inscription lundi 17 décembre 2012 Statut Membre Dernière intervention 19 janvier 2013 22
1 janv. 2013 à 21:22
Bonsoir et Bonne Année,
Sans modèle je me contenterai d'une suggestion.
Si tes fichiers, ou feuilles, ont une présentation identique,
1) tu fais un Copier/Coller de toutes tes données les unes à la suite des autres en un seul grand tableau.
2) Tu tries par Nom, prénom. Déjà tu as un tableau unique, avec les mêmes personnes regroupées quelque soit le tableau où elles figuraient initialement.
3) Si la notification des activités enregistrées figure sur des colonnes séparées et si elles sont assez "fixes et normées" (Arts, musique, cinéma, automobile, etc), tu prévois autant de colonnes que d'activités ou centre d'intérêts. Alors tu peux envisager d'apposer une croix en face de chaque nom pour chacune de ces activités. Pour ce faire il te suffira d'un code simple pour faire la manoeuvre.
Il faudrait avoir un exemple de qq lignes pour se faire une idée plus précise.
Cordialement.
1
Tessel75 Messages postés 192 Date d'inscription lundi 17 décembre 2012 Statut Membre Dernière intervention 19 janvier 2013 22
1 janv. 2013 à 22:20
Aller sur cjoint.com et puis suivre les indications. Re-poster le N° d'enregistrement ici pour l'avoir disponible. Attention pour copier ce N° , j'ai toujours eu des difficultés, il vaut mieux balayer et copier que se fier au bouton "Copier"

Il suffit d'une dizaine ou une vingtaine de lignes. Quant aux noms il suffit de les changer avec des noms de fruits et légumes, aucune importance.
1
Tessel75 Messages postés 192 Date d'inscription lundi 17 décembre 2012 Statut Membre Dernière intervention 19 janvier 2013 22
1 janv. 2013 à 23:59
Merci, j'ai ouvert. Quel est son format? Excel_20010 ou précédent ?
1
Tessel75 Messages postés 192 Date d'inscription lundi 17 décembre 2012 Statut Membre Dernière intervention 19 janvier 2013 22
2 janv. 2013 à 11:14
Bonjour, je travaille dessus mais ce sera un peu long (je travaille aussi) parce qu'il y a des boucles à organiser. Une autre question, le nombre de tes colonnes d'activités est-il fixe, et quel est le maximum ?
1

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
Tessel75 Messages postés 192 Date d'inscription lundi 17 décembre 2012 Statut Membre Dernière intervention 19 janvier 2013 22
7 janv. 2013 à 01:43
Bonjour,
J'ai presque terminé la proposition que j'envisage. Elle devrait comporter jusqu'à 20 colonnes pour les points d'intérêts à reproduire. Je l'enverrai demain soir parce que je veux faire une dernière vérification. Je ne crois pas que le fait que ce soit une version Mac pose des problèmes, mais il faut vous en assurer.
Un fichier plus copieux que 10 noms serait le bien venu. Il suffit d'anonymiser les noms par exemple en changeant certaines lettres (cela peut se faire facilement avec "Remplace" sur la colonne entière), et aussi le nom des villes par la même méthode.
1
Tessel75 Messages postés 192 Date d'inscription lundi 17 décembre 2012 Statut Membre Dernière intervention 19 janvier 2013 22
9 janv. 2013 à 22:44
Je joins ici un autre lien pour le même code, mais amélioré en ceci qu'il permet de traiter un nombre quelconque de colonnes sans limitation. Mis à part cet avantage, les autres restrictions et précautions quant à l'ordre des colonnes sont les mêmes, ça, il n'est pas possible de le changer.
C'est en fait ce que je souhaitais faire dès le départ. Bonne continuation et meilleurs voeux pour la suite.

https://www.cjoint.com/?3AjwLAPy7QE
1
girafette18 Messages postés 5 Date d'inscription mardi 1 janvier 2013 Statut Membre Dernière intervention 2 janvier 2013
1 janv. 2013 à 21:38
Hello ! Merci et très bonne année à toi également !

Merci beaucoup de ta réponse.

En réalité, j'avais déjà fait le regroupement de ces contacts dans un seul fichier, et ai créé 4 colonnes pour les 4 domaines (en coloriant les contacts de chaque domaine d'une couleur différente, ce qui ne sert visiblement à rien :-) ) et j'aurais en fait besoin du code dont tu parles, justement. Je viens d'adapter mon fichier avec des croix comme tu le suggères. Je ne peux pas envoyer le fichier total car il est confidentiel (c'est professionnel) - et il contient 10'000 noms, mais je t'envoie volontiers un résumé que je vais créer. Je suis nouvelle et ne sais pas comment te l'envoyer... pourrais-tu me l'indiquer stp ?

Un grand merci à toi de ton aide,

Cordialement.
0
girafette18 Messages postés 5 Date d'inscription mardi 1 janvier 2013 Statut Membre Dernière intervention 2 janvier 2013
1 janv. 2013 à 22:34
Super merci.

Le voilà : https://www.cjoint.com/?0AbwGnk5vWQ

Je l'ai copié manuellement. Arrives-tu à l'ouvrir ?

Merci !
0
girafette18 Messages postés 5 Date d'inscription mardi 1 janvier 2013 Statut Membre Dernière intervention 2 janvier 2013
2 janv. 2013 à 10:48
Excel 2010 je pense oui (acheté en décembre 2011) pour Mac par contre
0
girafette18 Messages postés 5 Date d'inscription mardi 1 janvier 2013 Statut Membre Dernière intervention 2 janvier 2013
2 janv. 2013 à 11:26
C'est très gentil à toi, je te remercie beaucoup.

Le nombre est fixe pour ces quatre fichiers (donc quatre colonnes d'activités) mais je devrais normalement en ajouter par la suite.

Souhaites-tu que je t'envoie un modèle avec plus de colonnes (sans les croix pour l'instant) avec des genres fictifs ? Je pense que 10 suffiront dans tous les cas. A toi de me dire si ça complique ton travail ou non, sinon 7 serait déjà très bien.

Dans un deuxième temps, je devrai regrouper ce nouveau fichier de contacts "uniques avec leurs infos", avec un autre fichier qui n'est qu'une liste de noms, afin de repérer les doublons (et les garder) et les non-doublons, en indiquant pour chaque contact de quel fichier il provient initialement.

Sais-tu s'il y a un moyen pour que je puisse appliquer cette formule à d'autres fichiers ? Il sera question que je reçoive d'autres fichiers de contacts, et j'aimerais pouvoir reproduire cette solution plusieurs fois si possible. Il faudrait peut-être que je suive une formation... J'imagine qu'il n'existe pas une formule unique.

Merci...
0
Hello !

Je te renvoie le fichier avec plus de noms. Est-ce que cela suffit ou il en faut beaucoup plus ?

J'ai ajouté trois colonnes dans les "données" : Société, Source, et Email. Si cela te pose problème, je peux les enlever. Je me dis que je pourrais en avoir besoin un jour, en fonction des autres fichiers qui viendront...

Je te remercie beaucoup de ton aide et reste à disposition si tu as besoin d'autre chose !
Merci !
0
avec le lien... http://cjoint.com/?0AhuDMthQLR
0
Tessel75 Messages postés 192 Date d'inscription lundi 17 décembre 2012 Statut Membre Dernière intervention 19 janvier 2013 22
8 janv. 2013 à 02:07
Bonsoir,

https://www.cjoint.com/?3AibJV1DV9y

Vous trouverez le fichier avec le code VBA pour supprimer des lignes tout en recopiant les données déjà entrées.
Plusieurs points IMPORTANTS doivent être soulignés.
1) Les colonnes de vos tableaux à regroupés doivent impérativement être identiques au tableau que vous avez envoyé ce soir. Tout est calculé pour fonctionner avec ces colonnes et aussi des colonnes supplémentaires, mais pas du tout avec des colonnes intermédiaires. Le tableau que vous avez envoyé ce soir avec une colonne "Sociétés" m'a obligé à revoir le travail de 2 jours.

2) Vous pouvez éventuellement intervertir les colonnes avec la notification des points d'intérêts mais en aucun cas celles ayant trait aux identités des personnes puisque c'est celles-là qui sont utilisées pour trier et classer les personnes. Cela évidemment sauf si vous êtes en mesure de changer la partie de programme qui effectue ce tri et ce classement.

3) si vous voulez ajouter d'autres fichiers du même type à un fichier déjà constitué, ils doivent avoir exactement la même organisation que le premier, sinon vous risquez de mélanger les points d'intérêts des personnes.

4) Je ne sais pas si vous avez l'habitude de travailler avec les macros.
Si c'est le cas, il n'y a pas de problème particulier.
Si vous ne connaissez pas: il suffit d'ouvrir le fichier actuel et celui sur lequel vous voulez travailler. Sélectionner la page que vous voulez regrouper et ordonner, ouvrir le ruban Affichage / Macros / Afficher les macros / (Au besoin dans la fenêtre sélectionner Tous les fichiers ouverts) et dans la liste des macros choisir la macro SupprimerLesDoublonsSansPerdreLesDonnees et cliquer sur Exécuter.
Le reste se fera tout seul.

Si vous souhaitez déplacer la macro, il est important de savoir que les 2 procédures sont dépendantes et ne peuvent pas être séparées.

Bonne continuation et bon courage.
0
Tessel75 Messages postés 192 Date d'inscription lundi 17 décembre 2012 Statut Membre Dernière intervention 19 janvier 2013 22
8 janv. 2013 à 02:22
Re;
Je n'avais nul besoin de 10000 noms et moins encore de noms particuliers. Il ne s'agit que d'un travail technique, des noms de fleurs, de célébrités mortes depuis longtemps comme des musiciens ou des personnages historiques ou encore des noms de fruits et légumes auraient très bien fait l'affaire. Il ne s'agissait que d'en avoir davantage que 10 pour vérifier que tout tournait bien.
Pour ce qui est du nombre de colonnes, le code que j'ai envoyé tourne avec 20 colonnes en plus de ceux réservés pour l'identité càd colonne A à Colonne 8. Par contre il ne faut surtout pas les mélanger.
Bon courage
0
Re !

Merci beaucoup.

C'est magique, mais ça s'est arrêté à la fin de la lettre A, à la ligne 509... Parfois il y a deux croix dans la même colonne, qu'est-ce que ça signifie ? Je vous avoue que je ne connais pas les macros.

Merci infiniment, je ne savais pas que cela vous prendrait autant de temps... et que ce serait aussi efficace ! Comment puis-je vous remercier ??
0
Tessel75 Messages postés 192 Date d'inscription lundi 17 décembre 2012 Statut Membre Dernière intervention 19 janvier 2013 22
9 janv. 2013 à 01:26
Bonjour,
1) Qu'il y ait des doubles croix est normal. J'ai préféré prendre le risque d'avoir des doubles croix que voir disparaitre des informations; ainsi j'ai posé comme opération non pas copier/coller simple (à la place de) mais copier/coller par ajout, autrement dit Cells(n, p) & cells(n+1,p). Si une croix est déjà entrée sur deux des lignes, le codes les juxtapose justement pour éviter que si 2 informations différentes figurent à des lignes différentes, la 2ème se substitue à la 1ère en l'effaçant.
2) Que le code s'arrête après la lettre A est plus inquiétant. Etes-vous sûre qu'il n'y a pas un trou dans la succession des données. Car alors oui, s'il manque un "Madame" ou "Monsieur" le calcul du nombre des lignes à traiter s'interrompt. Dans ce cas, il suffit de combler le trou, et de repartir de là où les opérations se sont interrompues. Il n'y a aucun inconvénient à cela.
0
1) ok pas de soucis, c'était pour comprendre

2) En effet, il manquait 3 Madame ou Monsieur dans mon fichier général... et tout fonctionne a merveille maintenant !

C'est impressionnant, je te remercie infiniment.

Comment puis-je te remercier ? J'ai gagné des heures de travail, et tu en a perdu plusieurs...
0
Un énorme merci à vous, pour TOUT !
Plein de belles choses pour 2013.

Bien à vous.
0
Tessel75 Messages postés 192 Date d'inscription lundi 17 décembre 2012 Statut Membre Dernière intervention 19 janvier 2013 22
11 janv. 2013 à 00:15
Bien reçu. Merci!
0