Comment supprimer des "quasi doublons" sans perte de données ? (excel

Fermé
FabienGreppo Messages postés 2 Date d'inscription lundi 22 juin 2020 Statut Membre Dernière intervention 23 juin 2020 - 22 juin 2020 à 10:11
Raymond PENTIER Messages postés 58393 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 23 avril 2024 - 23 juin 2020 à 16:49
Bonjour à tous,

J'ai un fichier excel de +/- 35 000 lignes qui contient un grand nombre de quasi doublons.

Un fichier vaut mieux que 1000 mots, donc je vous mets une situation ci-dessous qui résume parfaitement les problématiques rencontrées. Il contient 5 lignes et j'aimerais en avoir 2 à la fin du dédoublonnage sans pour autant perdre d'informations.






Est-il possible de "rassembler" des lignes doublons par une sorte de concatener horizontal ?

J'espère que ma situation sera claire pour vous mais n'hésitez pas à revenir vers moi au besoin :).

Milles mercis,

Fabien
A voir également:

4 réponses

Raymond PENTIER Messages postés 58393 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 23 avril 2024 17 096
22 juin 2020 à 13:26
Bonjour Fabien.

C'est une très mauvaise idée !
Conserve tes 35000 lignes, et utilise les outils de tri et de filtre, ou encore les tableaux croisés dynamiques ...
N'oublie pas que tu disposes de 65536 lignes sur Excel 2003 et de 1045576 lignes depuis Excel 2007 !
0
FabienGreppo Messages postés 2 Date d'inscription lundi 22 juin 2020 Statut Membre Dernière intervention 23 juin 2020
23 juin 2020 à 10:35
Bonjour Raymond et merci pour ton retour.

Je crois effectivement devoir passer par les tableaux croisés dynamiques mais j'espèrais que l'expérience de la communauté aurait peut être déjà des règles pré-définies pour répondre à ces problématiques et dégrossir :)

Sinon, j'ai défini une règle dans ce cas mais je ne sais pas comment l'exploiter ou si elle est bien trop floue.

Dans ce cas, la règle serait :
- Si A / D / E / F est identique ou proche (j'ai cru comprendre qu'il était possible d'exclure de la logique les virgules et différences minimes telles que les articles "Le" "Au" etc.)
- Si B / C est identique (on garde 3 chiffres après la virgule pour la comparaison)

--> on regroupe les lignes
--> dans le cas de B et C, on garde l'info qui contient le plus de chiffres après la virgule
--> pour les autres colonnes idéalement il faudrait les concatener avec un indicateur de séparation type / \ etc.
0
yg_be Messages postés 22720 Date d'inscription lundi 9 juin 2008 Statut Contributeur Dernière intervention 23 avril 2024 1 476
23 juin 2020 à 11:04
bonjour, si je voulais réaliser cela, je développerais un petit programme VBA qui ferait ce travail.
0
Raymond PENTIER Messages postés 58393 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 23 avril 2024 17 096
23 juin 2020 à 16:49
Bonjour Fabien.

Manifestement, tu n'es pas habitué à CCM ni aux forums d'entraide, en général :
  • Au lieu d'envoyer ton fichier Excel, ou un extrait sans contenu confidentiel, tu envoies de simples images qui ne nous permettent pas de travailler.
  • Tu expliques ton problème en donnant des références de colonnes, mais celles-ci n'apparaissent pas sur tes images ...
  • Le contenu de la deuxième image ne permet pas de savoir de quelles lignes de la première image elles proviennent !

Je ne sais même pas si tu t'y retrouves toi-même ...
 1) Tu vas dans https://www.cjoint.com/ 
2) Tu cliques sur [Parcourir] pour sélectionner ton fichier (15 Mo maxi)
3) Tu défiles vers le bas pour cliquer sur le bouton bleu [Créer le lien Cjoint]
4) Au bout de quelques secondes la deuxième page s'affiche, avec le lien en gras ; tu fais un clic-droit dessus et tu choisis "Copier le lien"
5) Tu reviens dans ta discussion sur CCM, et dans ton message tu fais "Coller".
=>Voir la fiche https://www.commentcamarche.net/faq/29493-utiliser-cjoint-pour-heberger-des-fichiers
Il existe aussi :
1) https://mon-partage.fr/
2) https://www.transfernow.net/

0