Faire en sorte que tout s'écrive pareil

cylia2015 Messages postés 45 Date d'inscription mardi 10 juillet 2018 Statut Membre Dernière intervention 27 août 2024 - 26 août 2024 à 16:52
cylia2015 Messages postés 45 Date d'inscription mardi 10 juillet 2018 Statut Membre Dernière intervention 27 août 2024 - 27 août 2024 à 11:29

Bonjour, Je sollicite votre aide pour mettre en place un processus de nettoyage de données dans Excel. L'objectif est d'unifier les écritures d'une colonne de noms de fournisseurs qui présentent de nombreuses variations (ex : Renault SP, Renaul). Le fichier est volumineux (600 000 lignes).

merci d'avance


Windows / Chrome 127.0.0.0

10 réponses

danielc0 Messages postés 1137 Date d'inscription mardi 5 juin 2018 Statut Membre Dernière intervention 17 septembre 2024 132
27 août 2024 à 10:20

Bonjour,

C'est sans garantie, mais j'aimerais voir le fichier complet avant d'abandonner. Je serais curieux de tester Fuzzy Lookup. Peux-tu le partager ?

Daniel


1
danielc0 Messages postés 1137 Date d'inscription mardi 5 juin 2018 Statut Membre Dernière intervention 17 septembre 2024 132
26 août 2024 à 17:06

Bonjour,

C'est le genre de manips compliquées. Il faudrait déjà fournir un fichier exemple réduit. Peux-tu partager le classeur ?
Pour le partager, clique sur :
https://www.cjoint.com/
Clique sur le bouton "parcourir". Choisis le fichier à partager. Dans le bas de la page, clique sur le bouton "Créer le lien cjoint". Copie le lien affiché et colle-le dans ta réponse.

Daniel


0
cylia2015 Messages postés 45 Date d'inscription mardi 10 juillet 2018 Statut Membre Dernière intervention 27 août 2024
26 août 2024 à 17:24

  le lien de mon fichier  est:

https://www.cjoint.com/c/NHApxVOavIC

0
danielc0 Messages postés 1137 Date d'inscription mardi 5 juin 2018 Statut Membre Dernière intervention 17 septembre 2024 132
26 août 2024 à 17:34

Super, mais tu veux les standardiser comment ?

Daniel


0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
danielc0 Messages postés 1137 Date d'inscription mardi 5 juin 2018 Statut Membre Dernière intervention 17 septembre 2024 132
26 août 2024 à 18:44

Avec le complément "Fuzzy Lookup", en partant de cette table :

Je corrige comme suit :

Ca vaut peut-être le coup d'essayer avec un fichier plus complet. Il faut construire la première table pour obtenir la seconde.

Daniel


0
cylia2015 Messages postés 45 Date d'inscription mardi 10 juillet 2018 Statut Membre Dernière intervention 27 août 2024
27 août 2024 à 11:29

Merci beaucoup, Daniel ! Ta proposition me paraît top pour traiter mon fichier plus vite.

0
Raymond PENTIER Messages postés 58649 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 17 septembre 2024 17 197
26 août 2024 à 19:39

Bonjour cylia.

600 00 lignes ! Tu n'es pas arrivée au bout de tes peines !

Comme l'indique Daniel, sur quels critères se baser ?
Ni une macro, ni aucun d'entre nous n'est en mesure de deviner si RANAULT et RENAULT c'est pareil, si RENAULT SPA et RENAULT SARL c'est pareil ...

J'aurais à faire ce travail, j'afficherais les boutons TRIER/FILTRER en première ligne, je sélectionnerais par exemple RENAULT - A3 AUTO, ce qui afficherait les lignes 14 et 16 ; puis je saisirais "RENAULT A3 AUTO" en B14 et B16 (en effet avec CTRL+H ça ne marche pas, car ce sont des espaces insécables qui entourent "-").

Tu auras à recommencer ce travail quelques milliers de fois, manifestement !

La prochaine fois, donne des instructions aux opérateurs de saisie pour unifier l'orthographe des fournisseurs !!!


0
cylia2015 Messages postés 45 Date d'inscription mardi 10 juillet 2018 Statut Membre Dernière intervention 27 août 2024
27 août 2024 à 09:40

Merci pour votre aide.

0
cylia2015 Messages postés 45 Date d'inscription mardi 10 juillet 2018 Statut Membre Dernière intervention 27 août 2024
27 août 2024 à 09:46

Il semblerait qu’il n’existe pas d’autre solution que de reprendre la saisie.

0
cousinhub29 Messages postés 936 Date d'inscription mardi 10 août 2010 Statut Membre Dernière intervention 11 septembre 2024 339
27 août 2024 à 10:48

Bonjour,

Tout comme daniel te le conseille, on ne risque rien d'essayer de t'aider.

Par le biais de Power Query (nativement installé depuis Office 2016), en fusionnant de manière "approximative", avec un seuil de similarité de 0.8, voici ce que j'obtiens :

Comme tu peux le voir, j'adopte le même principe que daniel, en établissant au préalable une base de référence (en orange), puis je compare les deux (colonne B et base de référence), pour en sortir la colonne C (Correspondance)

Donc, tout n'est pas perdu...

Courage


0
cylia2015 Messages postés 45 Date d'inscription mardi 10 juillet 2018 Statut Membre Dernière intervention 27 août 2024
27 août 2024 à 11:26

Merci beaucoup, je suis en train d'appliquer les conseils de Daniel.

0