Extraction d'une chaîne de caractères - abréviations de langues

frefre923 Messages postés 2 Statut Membre -  
 axions -
Bonjour,

J'ai besoin de votre aide pour mon fichier comportant de nombreuses données. Je dois calculer le nombre d'objets génériques qui ont été développés en plusieurs langues.
Ex : j'ai créé un paquet de yaourts A dont l'emballage a été développé en 3 versions : français, anglais, japonais...
--> le fichier comporter 3 libellés pour cet objet générique.

Mon fichier comporte tous les libellés de toutes les versions créées mais je ne sais pas comment obtenir uniquement la liste des objets génériques.

Précisions importantes :
- la langue est toujours indiquée à la fin du libellé, mais de manière fantaisiste.
Anglais peut être codé ANG ou GB ou UK ou /ANG ou /GB ou / GB (avec espace entre tiret et GB) etc.
A multiplier par le nombre de langues existant sur Terre...
- il existe des libellés sans langue si un objet n'a pas été décliné selon les langues

Attention : PAQUET DE YAOURTS ne doit pas être considéré comme un paquet de yaourts allemand (pour DEutsch).
PAQUET DE FRAMBOISES ne doit pas être considéré comme un paquet français (FR pour français)

QUelqu'un peut-il m'aider ?

J'ai donc besoin :
1. d'une colonne où les abréviations de langue de chaque libellé disparaissent (s'il y a lieu)
2. de compter le nombre d'objets génériques

Ci-joint un fichier fictif pour mieux visualiser, où figurent 7 objets et 22 libellés
https://www.cjoint.com/?0KBpn2xmlCO

Merci infiniment à toutes les bonnes âmes qui voudront bien m'aider !
A voir également:

2 réponses

Raymond PENTIER Messages postés 71871 Date d'inscription   Statut Contributeur Dernière intervention   17 402
 
Eh ben !

Habituellement, on se fixe des règles rigoureuses de saisie des données, ce qui permet de les exploiter à loisir et sans erreur.
Ici, tu comptes sur Excel pour repérer toutes les fantaisies et anomales de saisie !
Cela ne va pas être facile ...
Et même si on travaille sur ton fichier exemple pour optimiser les 12 codes de langue, comment feras-tu pour traiter les quelques 80 autres ?
D'autre part, nous pouvons essayer de te débarrasser des abréviations de langue en fin d'intitulé, mais ça ne marchera pas avec les libellés sans langue ... alors il faut sérieusement envisager d'ajouter FR pour ces cas-là ...

On pourrait aussi envisager d'utiliser les filtres d'Excel, mais si ta liste de libellé est trop longue, ça pourrait ne pas marcher ; ton fichier arrive jusqu'à quelle ligne ?

C'est bien, la retraite ! Surtout aux Antilles ... :-)
☻ Raymond ♂
0
frefre923 Messages postés 2 Statut Membre
 
Bonjour Raymond,
Eh oui, j'ai hérité du fichier du service où une quinzaine de personnes entre des données, d'où les fantaisies quant au codage...
Et pour répondre à ta question, le fichier fait 26000 lignes...
0
Raymond PENTIER Messages postés 71871 Date d'inscription   Statut Contributeur Dernière intervention   17 402
 
Alors le filtre ne pourra pas étaler 26000 lignes de données !
Et il faudra mettre un apprenti ou un stagiaire sur le fichier pour harmoniser un peu les codages, car pour le moment ce fichier n'est pas une base de données, mais juste un "foutoir" inexploitable ..
0
axions
 
Bonjour,

voici une proposition qui permet à excel de savoir ce qu'il doit chercher
donc il y a encore du boulot de traitement pour dé multiplexer-multiplexer les infos.
cette proposition n'est sûrement pas la panacée, mais offre une approche et demande à être remplacée par une macro (qui me rendrait également service)

le lien : http://cjoint.com/?0KEbCwWquiq
à copier (sans espace avant ou après) et coller dans la barre de recherche

quelques explications in situ, mais PAS TESTE sur 26 000 lignes !
car les données de base peuvent subir un traitement par lots

Bonne suite
Cordialement
0