Modifier contenu de plusieurs cellules qui se ressemblent avec le même contenu

Résolu
jujumty Messages postés 28 Date d'inscription   Statut Membre Dernière intervention   -  
 eugene -
Bonjour à tous,

J'ai un fichier excel avec 38 148 lignes, chaque ligne contient des infos sur des articles scientifiques : ex
Goldsby, T.J., Griffis, S.E., Roath, A.S., Modeling lean, agile, and leagile supply chain strategies (2006) Journal of Business Logistics, 27 (1), pp. 57-80

Je souhaite par la suite calculer les fréquences, c'est à dire combien de fois l'article de Goldsby apparaît.
Le problème c'est que parfois, Goldsby va être écrit avec une majuscule, parfois une minuscule, parfois le journal sera "Journal of Business Logistics" parfois "Journal of Bus Log".
Faussant par la suite mes résultats de fréquence.

Pensez-vous qu'il existe une fonction excel qui fasse en gros : des que les cases se ressemble, remplace tout par le même ?

En gros : Si A1 ressemble à A2 et/ou à A3 alors remplacer A1, A2 et A3 par A1 (et ainsi de suite avec tous les articles)

Par ce que sinon je suis entrain de le faire à la main, mais je pense qu'avec ce nombre de lignes j'en ai encore pour plusieurs années.

Merci d'avance !!
A voir également:

6 réponses

Raymond PENTIER Messages postés 58982 Date d'inscription   Statut Contributeur Dernière intervention   17 345
 
Bonjour.
Pensez-vous qu'il existe une fonction excel qui fasse en gros : des que les cases se ressemble, remplace tout par le même ? En gros : Si A1 ressemble à A2 et/ou à A3 alors remplacer A1, A2 et A3 par A1 (et ainsi de suite avec tous les articles)

Non, je n'en connais pas. Tu devras probablement passer par une macro, si tu connais VBA.

Avec les outils classiques Tri et Filtre, je crains que 38000 lignes, cela fasse ramer Excel ...
Mais tu pourrais d'abord effectuer un tri, puis fractionner ton tableau en 10 ou 50 tableaux plus petits (par exemple une feuille pour les lignes commençant par A) ...
Dans un troisième temps, tu pourrais appliquer un filtre automatique personnalisé, ou carrément un filtre avancé https://support.office.com/fr-fr/article/filtrer-à-l-aide-de-critères-avancés-4c9222fe-8529-4cd7-a898-3f16abdff32b
Parvenu à ce stade, tu peux utiliser l'outil Remplacer (Ctrl+H) ...

Mais c'est peut-être bien ce que tu voulais dire par "je suis en train de le faire à la main" ?

Cordialement.
0
Raymond PENTIER Messages postés 58982 Date d'inscription   Statut Contributeur Dernière intervention   17 345
 
Quelle taille fait ton fichier ?
0
jujumty Messages postés 28 Date d'inscription   Statut Membre Dernière intervention  
 
Exactement j'ai commencépar filtrer par nom.
Je copie colle la case A1 dans A2, A3... A15 (si c'est le même article mais écrit de façon différente).
Le problème c'est qu'en plus d'être très long je peux, sans faire exprès, une erreur manuelle. (par exemple collé encore A1 dans A16 alors que c'est un article différent...)
J'aurais aimé une solution automatique.
Je connais un peu VBA (je ne suis pas très douée), mais je ne saurais même pas quoi mettre dans la macro.. auriez-vous une idée ?
0
jujumty Messages postés 28 Date d'inscription   Statut Membre Dernière intervention  
 
Bonjour,
il fait 6 612 Ko
0
eriiic Messages postés 24603 Date d'inscription   Statut Contributeur Dernière intervention   7 273
 
Bonjour,

tu as l'addin Fuzzy Lookup (recherche floue) de MS qui pourrait t'aider ici : https://www.microsoft.com/en-us/download/details.aspx?id=15011
Une présentation ici : http://www.emarketeur.fr/ressources/productivite/comparaison-listes-excel-fuzzy-logic-donne-coup-de-vieux-vlookup/

Le soucis que tu risques de rencontrer est que tu veux une recherche approximative (déjà pas fiable à 100%) mais surtout sur une partie de chaine ce qui t'oblige à baisser le seuil d'acceptabilité, et donc plus de faux positifs....
eric


0
jujumty Messages postés 28 Date d'inscription   Statut Membre Dernière intervention  
 
Je te remercie ! ça à l'air génial et exactement ce dont j'ai besoin.
Seule question, dans l'exemple de emarketour, il compare entre deux colonnes, malheureusement je n'en ai qu'une. Penses-tu que ça fonctionne ?
0
eriiic Messages postés 24603 Date d'inscription   Statut Contributeur Dernière intervention   7 273 > jujumty Messages postés 28 Date d'inscription   Statut Membre Dernière intervention  
 
hum, je ne pense pas que ce soit adapté pour ce fonctionnement.
En plus je ne sais pas si te rends compte de ce que représente de faire 38000! comparaisons, sur des chaines où c'est bien lent en plus.
Même si tu loues l'ordinateur du CEA ça risque d'être juste. Attend les processeurs quantiques ;-)

Il faudrait découper le travail.
En te créant un dictionnaire des auteurs dans une autre colonne déjà, pour les normaliser.
Ensuite pour les expressions, je ne vois pas trop comment simplifier...
Dépose un fichier sur cjoint.com qu'on voit à quoi ça ressemble, mais je ne le sens pas bien...
eric
0
jujumty Messages postés 28 Date d'inscription   Statut Membre Dernière intervention   > eriiic Messages postés 24603 Date d'inscription   Statut Contributeur Dernière intervention  
 
C'est bon le document est sur le site, il s'appelle BDD 678 scopus. c'est un out file (je l'ouvre avec excel cela fonctionne) :D
Voici le lien !
https://www.cjoint.com/c/JBkiIleTuuM
0
jujumty Messages postés 28 Date d'inscription   Statut Membre Dernière intervention  
 
Oui en effet j'ai passé la fin du dimanche à regarder ce qui se rapproche le plus c'est l' algorithme Levenshtein mais en macro déjà pour 100 lignes ça bug alors plus de 38 000 x 38 000 je pense que ça ne passera jamais... je vous mets quand même le fichier au cas ou mais je pense que je vais faire les plus important à la main, enlever toutes les majuscules, faire un recherche et remplace sur les journaux les plus connus et voilà hahaha !

Merci quand même :D
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
Raymond PENTIER Messages postés 58982 Date d'inscription   Statut Contributeur Dernière intervention   17 345
 


Voici ce que j'ai pu élaborer pour commencer :
https://cjoint.com/c/JBkxI5sMDoM
0
jujumty Messages postés 28 Date d'inscription   Statut Membre Dernière intervention  
 
Super merci beaucoup, je vais essayer comme ça et voir :D
0
eugene
 
Bonjour,
Peut-être pourriez-vous voir du côté de la fonction Excel / Données / Convertir, délimité par des virgules, ce qui découperait votre tableau en tranches, et utiliser la fonction de filtre automatique.
Si cela peut faire avancer le schmilblick...
Cordialement
https://cjoint.com/c/JBlgK3FaOzN
https://cjoint.com/c/JBlg2rw63uN
0
jujumty Messages postés 28 Date d'inscription   Statut Membre Dernière intervention  
 
Merci beaucoup, j'avais essayé cette étapes mais ça ne rendait pas aussi bien, j'avais des problèmes avec mes colonnes !
0
eugene > jujumty Messages postés 28 Date d'inscription   Statut Membre Dernière intervention  
 
Je vous avais suggéré ces fonctions à tout hasard.
Par curiosité, est-ce que cela vous a effectivement aidé ?
0