Comparer 2 feuilles excel différement structu

Fermé
saisai01 Messages postés 2 Date d'inscription mardi 3 mars 2009 Statut Membre Dernière intervention 4 mars 2009 - 3 mars 2009 à 21:06
 XLComparator - 14 août 2009 à 10:08
Bonjour,
Je souhaite comparer deux feuilles excel différement structurées avec un algo du libre.
En fait j'ai deux fichiers clients qui sont à peu de choses semblables [Entreprise, Contact, adresses, e-mail...]
j'en ai une qui contient plus de champs que l'autre et je dois les mettre ensemble de manière à en extraire les nombreux doublons.
Le faire à la main est quasi impossible parceque par exemple la colonne [Entreprise] peut avoir dans une des feuile la valeur "Azerty Motors inc" et dans l'autre "Azerty S.A." avec la meme adresse par exemple.
Je suis certain de n'etre pas le seul a etre confronté à ce probleme avec de gros fichiers.

Même une piste de réponse pourrait m'aider à avancer un peu plus vite.
C'est pas que je n'ai pas essayé de chercher, mais via les moteurs de recherche je n'atterrit que sur des solutions payantes qui ne m'offrent aucune garantie de résultat fiable.

Je compte sur votre assitance et remercie d'avance tous ceux qui posterons une solution.

Meilleures salutations !
A voir également:

3 réponses

gbinforme Messages postés 14946 Date d'inscription lundi 18 octobre 2004 Statut Contributeur Dernière intervention 24 juin 2020 4 709
3 mars 2009 à 23:45
bonjour

je n'atterrit que sur des solutions payantes qui ne m'offrent aucune garantie de résultat fiable

Il ne peut pas y avoir de résultat fiable dans ce que tu essayes de faire.

Quand on veux avoir uns base bien structurée et fiable, on la saisis avec un formulaire de contrôle. Si l'on laisse saisir "n'importe quoi", on aura toujours "n'importe quoi".

Tu dis que le nom peut avoir plusieurs libellés mais il en est de même de l'adresse ou même du code postal où des chiffres peuvent être inversés.

Donc toutes les macros que tu va écrire ne feront que de l'a peu près et si l'on t'en propose une (et il y en a certaines déjà sur le site, pour des problèmes similaires) tu ne trouveras pas le résultat fiable.

dans une des feuile la valeur "Azerty Motors inc" et dans l'autre "Azerty S.A."

Tu peux aussi avoir "Aserty S.A.R.L." et aucun algorithme n'est à même de dénicher toutes les variantes de vrais et faux doublons. Il faut en passer par la connaissance de ceux qui ont saisi tout cela et c'est loin d'être gagné.
1
XLComparator
14 août 2009 à 10:08
saisai01,
as tu essayé l'outil gratuit XLComparator :
https://www.xlcomparator.net/ ?
Il ne trouvera que les doublons strictement identiques mais cela permet de réduire le nombre de lignes à traiter manuellement...
A+
Marc
1
Raymond PENTIER Messages postés 58726 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 19 novembre 2024 17 242
4 mars 2009 à 01:38
gbinforme, comme à son habitude, t'a fourni d'excellents éléments
d'appréciation du problème. Il t'appartient d'en tenir compte.

Juste une piste : tu peux toujours effectuer une RECHERCHE en utilisant les caractères génériques quand tu soupçonnes des différences de saisie. L'Aide de Word indique :

N'importe quel caractère unique ? 
--> s?t trouve sot et set.  

N'importe quelle chaîne de caractères * 
--> s*t trouve saut et salut. 

Le début d'un mot < 
--> <(inter) trouve intersection et interception mais pas réinterprétation. 

La fin d'un mot  > 
--> (en)> trouve en et bien, mais pas souvent. 

Un des caractères spécifiés [ ] 
--> t[oi]c trouve toc et tic. 

N'importe quel caractère compris dans la plage spécifiée  [-] 
--> Par exemple, tou[r-t] recherche « tour » et « tout ». 
Les limites de la plage doivent être indiquées dans l'ordre croissant. 

N'importe quel caractère unique, à l'exception de ceux
compris dans la plage indiquée entre les crochets droits 
--> [!x-z] t[!a-m]c trouve toc et tuc mais pas tac ou tic. 

Exactement n occurrences du caractère ou de l'expression précédente {n} 
--> im{2}a trouve immaculée mais pas image. 

Au moins n occurrences du caractère ou de l'expression précédente {n,} 
--> fe{1,}d trouve fed et feed. 

De n à m occurrences du caractère ou de l'expression précédente {n,m} 
--> 10{1,3} trouve 10, 100 et 1000. 

Une ou plusieurs occurrences du caractère ou de l'expression qui précède @ 
--> po@t trouve port et pont. 
0
saisai01 Messages postés 2 Date d'inscription mardi 3 mars 2009 Statut Membre Dernière intervention 4 mars 2009
4 mars 2009 à 06:00
Merçi pour vos réponses,

Evidement je me doutais bien que ce que je voulais était quasi impossible à realiser. Je cherchais juste une solution qui me permette de réduire la charge de travail et les risque d'erreurs que cela représente.
0