Comment supprimer des "quasi doublons" sans perte de données ? (excel

Signaler
Messages postés
2
Date d'inscription
lundi 22 juin 2020
Statut
Membre
Dernière intervention
23 juin 2020
-
Messages postés
51862
Date d'inscription
lundi 13 août 2007
Statut
Contributeur
Dernière intervention
3 juillet 2020
-
Bonjour à tous,

J'ai un fichier excel de +/- 35 000 lignes qui contient un grand nombre de quasi doublons.

Un fichier vaut mieux que 1000 mots, donc je vous mets une situation ci-dessous qui résume parfaitement les problématiques rencontrées. Il contient 5 lignes et j'aimerais en avoir 2 à la fin du dédoublonnage sans pour autant perdre d'informations.






Est-il possible de "rassembler" des lignes doublons par une sorte de concatener horizontal ?

J'espère que ma situation sera claire pour vous mais n'hésitez pas à revenir vers moi au besoin :).

Milles mercis,

Fabien

4 réponses

Messages postés
51862
Date d'inscription
lundi 13 août 2007
Statut
Contributeur
Dernière intervention
3 juillet 2020
13 580
Bonjour Fabien.

C'est une très mauvaise idée !
Conserve tes 35000 lignes, et utilise les outils de tri et de filtre, ou encore les tableaux croisés dynamiques ...
N'oublie pas que tu disposes de 65536 lignes sur Excel 2003 et de 1045576 lignes depuis Excel 2007 !
Messages postés
2
Date d'inscription
lundi 22 juin 2020
Statut
Membre
Dernière intervention
23 juin 2020

Bonjour Raymond et merci pour ton retour.

Je crois effectivement devoir passer par les tableaux croisés dynamiques mais j'espèrais que l'expérience de la communauté aurait peut être déjà des règles pré-définies pour répondre à ces problématiques et dégrossir :)

Sinon, j'ai défini une règle dans ce cas mais je ne sais pas comment l'exploiter ou si elle est bien trop floue.

Dans ce cas, la règle serait :
- Si A / D / E / F est identique ou proche (j'ai cru comprendre qu'il était possible d'exclure de la logique les virgules et différences minimes telles que les articles "Le" "Au" etc.)
- Si B / C est identique (on garde 3 chiffres après la virgule pour la comparaison)

--> on regroupe les lignes
--> dans le cas de B et C, on garde l'info qui contient le plus de chiffres après la virgule
--> pour les autres colonnes idéalement il faudrait les concatener avec un indicateur de séparation type / \ etc.
Messages postés
11462
Date d'inscription
lundi 9 juin 2008
Statut
Contributeur
Dernière intervention
3 juillet 2020
655
bonjour, si je voulais réaliser cela, je développerais un petit programme VBA qui ferait ce travail.
Messages postés
51862
Date d'inscription
lundi 13 août 2007
Statut
Contributeur
Dernière intervention
3 juillet 2020
13 580
Bonjour Fabien.

Manifestement, tu n'es pas habitué à CCM ni aux forums d'entraide, en général :
  • Au lieu d'envoyer ton fichier Excel, ou un extrait sans contenu confidentiel, tu envoies de simples images qui ne nous permettent pas de travailler.
  • Tu expliques ton problème en donnant des références de colonnes, mais celles-ci n'apparaissent pas sur tes images ...
  • Le contenu de la deuxième image ne permet pas de savoir de quelles lignes de la première image elles proviennent !

Je ne sais même pas si tu t'y retrouves toi-même ...
 1) Tu vas dans http://cjoint.com/ 
2) Tu cliques sur [Parcourir] pour sélectionner ton fichier (15 Mo maxi)
3) Tu défiles vers le bas pour cliquer sur le bouton bleu [Créer le lien Cjoint]
4) Au bout de quelques secondes la deuxième page s'affiche, avec le lien en gras ; tu fais un clic-droit dessus et tu choisis "Copier le lien"
5) Tu reviens dans ta discussion sur CCM, et dans ton message tu fais "Coller".
=>Voir la fiche http://www.commentcamarche.net/faq/29493-utiliser-cjoint
Il existe aussi :
1) https://mon-partage.fr/
2) https://www.transfernow.net/