Modifier contenu de plusieurs cellules qui se ressemblent avec le même contenu

Résolu/Fermé
jujumty Messages postés 28 Date d'inscription mercredi 27 février 2019 Statut Membre Dernière intervention 6 février 2023 - Modifié le 9 févr. 2020 à 09:49
 eugene - 11 févr. 2020 à 18:32
Bonjour à tous,

J'ai un fichier excel avec 38 148 lignes, chaque ligne contient des infos sur des articles scientifiques : ex
Goldsby, T.J., Griffis, S.E., Roath, A.S., Modeling lean, agile, and leagile supply chain strategies (2006) Journal of Business Logistics, 27 (1), pp. 57-80

Je souhaite par la suite calculer les fréquences, c'est à dire combien de fois l'article de Goldsby apparaît.
Le problème c'est que parfois, Goldsby va être écrit avec une majuscule, parfois une minuscule, parfois le journal sera "Journal of Business Logistics" parfois "Journal of Bus Log".
Faussant par la suite mes résultats de fréquence.

Pensez-vous qu'il existe une fonction excel qui fasse en gros : des que les cases se ressemble, remplace tout par le même ?

En gros : Si A1 ressemble à A2 et/ou à A3 alors remplacer A1, A2 et A3 par A1 (et ainsi de suite avec tous les articles)

Par ce que sinon je suis entrain de le faire à la main, mais je pense qu'avec ce nombre de lignes j'en ai encore pour plusieurs années.

Merci d'avance !!

6 réponses

Raymond PENTIER Messages postés 58719 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 7 novembre 2024 17 233
9 févr. 2020 à 18:27
Bonjour.
Pensez-vous qu'il existe une fonction excel qui fasse en gros : des que les cases se ressemble, remplace tout par le même ? En gros : Si A1 ressemble à A2 et/ou à A3 alors remplacer A1, A2 et A3 par A1 (et ainsi de suite avec tous les articles)

Non, je n'en connais pas. Tu devras probablement passer par une macro, si tu connais VBA.

Avec les outils classiques Tri et Filtre, je crains que 38000 lignes, cela fasse ramer Excel ...
Mais tu pourrais d'abord effectuer un tri, puis fractionner ton tableau en 10 ou 50 tableaux plus petits (par exemple une feuille pour les lignes commençant par A) ...
Dans un troisième temps, tu pourrais appliquer un filtre automatique personnalisé, ou carrément un filtre avancé https://support.office.com/fr-fr/article/filtrer-à-l-aide-de-critères-avancés-4c9222fe-8529-4cd7-a898-3f16abdff32b
Parvenu à ce stade, tu peux utiliser l'outil Remplacer (Ctrl+H) ...

Mais c'est peut-être bien ce que tu voulais dire par "je suis en train de le faire à la main" ?

Cordialement.
0
Raymond PENTIER Messages postés 58719 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 7 novembre 2024 17 233
9 févr. 2020 à 18:28
Quelle taille fait ton fichier ?
0
jujumty Messages postés 28 Date d'inscription mercredi 27 février 2019 Statut Membre Dernière intervention 6 février 2023
9 févr. 2020 à 18:59
Exactement j'ai commencépar filtrer par nom.
Je copie colle la case A1 dans A2, A3... A15 (si c'est le même article mais écrit de façon différente).
Le problème c'est qu'en plus d'être très long je peux, sans faire exprès, une erreur manuelle. (par exemple collé encore A1 dans A16 alors que c'est un article différent...)
J'aurais aimé une solution automatique.
Je connais un peu VBA (je ne suis pas très douée), mais je ne saurais même pas quoi mettre dans la macro.. auriez-vous une idée ?
0
jujumty Messages postés 28 Date d'inscription mercredi 27 février 2019 Statut Membre Dernière intervention 6 février 2023
9 févr. 2020 à 18:55
Bonjour,
il fait 6 612 Ko
0
eriiic Messages postés 24600 Date d'inscription mardi 11 septembre 2007 Statut Contributeur Dernière intervention 21 octobre 2024 7 239
9 févr. 2020 à 19:20
Bonjour,

tu as l'addin Fuzzy Lookup (recherche floue) de MS qui pourrait t'aider ici : https://www.microsoft.com/en-us/download/details.aspx?id=15011
Une présentation ici : http://www.emarketeur.fr/ressources/productivite/comparaison-listes-excel-fuzzy-logic-donne-coup-de-vieux-vlookup/

Le soucis que tu risques de rencontrer est que tu veux une recherche approximative (déjà pas fiable à 100%) mais surtout sur une partie de chaine ce qui t'oblige à baisser le seuil d'acceptabilité, et donc plus de faux positifs....
eric


0
jujumty Messages postés 28 Date d'inscription mercredi 27 février 2019 Statut Membre Dernière intervention 6 février 2023
9 févr. 2020 à 19:59
Je te remercie ! ça à l'air génial et exactement ce dont j'ai besoin.
Seule question, dans l'exemple de emarketour, il compare entre deux colonnes, malheureusement je n'en ai qu'une. Penses-tu que ça fonctionne ?
0
eriiic Messages postés 24600 Date d'inscription mardi 11 septembre 2007 Statut Contributeur Dernière intervention 21 octobre 2024 7 239 > jujumty Messages postés 28 Date d'inscription mercredi 27 février 2019 Statut Membre Dernière intervention 6 février 2023
9 févr. 2020 à 23:52
hum, je ne pense pas que ce soit adapté pour ce fonctionnement.
En plus je ne sais pas si te rends compte de ce que représente de faire 38000! comparaisons, sur des chaines où c'est bien lent en plus.
Même si tu loues l'ordinateur du CEA ça risque d'être juste. Attend les processeurs quantiques ;-)

Il faudrait découper le travail.
En te créant un dictionnaire des auteurs dans une autre colonne déjà, pour les normaliser.
Ensuite pour les expressions, je ne vois pas trop comment simplifier...
Dépose un fichier sur cjoint.com qu'on voit à quoi ça ressemble, mais je ne le sens pas bien...
eric
0
jujumty Messages postés 28 Date d'inscription mercredi 27 février 2019 Statut Membre Dernière intervention 6 février 2023 > eriiic Messages postés 24600 Date d'inscription mardi 11 septembre 2007 Statut Contributeur Dernière intervention 21 octobre 2024
10 févr. 2020 à 09:35
C'est bon le document est sur le site, il s'appelle BDD 678 scopus. c'est un out file (je l'ouvre avec excel cela fonctionne) :D
Voici le lien !
https://www.cjoint.com/c/JBkiIleTuuM
0
jujumty Messages postés 28 Date d'inscription mercredi 27 février 2019 Statut Membre Dernière intervention 6 février 2023
10 févr. 2020 à 09:28
Oui en effet j'ai passé la fin du dimanche à regarder ce qui se rapproche le plus c'est l' algorithme Levenshtein mais en macro déjà pour 100 lignes ça bug alors plus de 38 000 x 38 000 je pense que ça ne passera jamais... je vous mets quand même le fichier au cas ou mais je pense que je vais faire les plus important à la main, enlever toutes les majuscules, faire un recherche et remplace sur les journaux les plus connus et voilà hahaha !

Merci quand même :D
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
Raymond PENTIER Messages postés 58719 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 7 novembre 2024 17 233
11 févr. 2020 à 00:38


Voici ce que j'ai pu élaborer pour commencer :
https://cjoint.com/c/JBkxI5sMDoM
0
jujumty Messages postés 28 Date d'inscription mercredi 27 février 2019 Statut Membre Dernière intervention 6 février 2023
11 févr. 2020 à 09:35
Super merci beaucoup, je vais essayer comme ça et voir :D
0
Bonjour,
Peut-être pourriez-vous voir du côté de la fonction Excel / Données / Convertir, délimité par des virgules, ce qui découperait votre tableau en tranches, et utiliser la fonction de filtre automatique.
Si cela peut faire avancer le schmilblick...
Cordialement
https://cjoint.com/c/JBlgK3FaOzN
https://cjoint.com/c/JBlg2rw63uN
0
jujumty Messages postés 28 Date d'inscription mercredi 27 février 2019 Statut Membre Dernière intervention 6 février 2023
11 févr. 2020 à 09:35
Merci beaucoup, j'avais essayé cette étapes mais ça ne rendait pas aussi bien, j'avais des problèmes avec mes colonnes !
0
eugene > jujumty Messages postés 28 Date d'inscription mercredi 27 février 2019 Statut Membre Dernière intervention 6 février 2023
Modifié le 11 févr. 2020 à 18:33
Je vous avais suggéré ces fonctions à tout hasard.
Par curiosité, est-ce que cela vous a effectivement aidé ?
0