Extraction d'une chaîne de caractères - abréviations de langues
frefre923
Messages postés
2
Statut
Membre
-
axions -
axions -
Bonjour,
J'ai besoin de votre aide pour mon fichier comportant de nombreuses données. Je dois calculer le nombre d'objets génériques qui ont été développés en plusieurs langues.
Ex : j'ai créé un paquet de yaourts A dont l'emballage a été développé en 3 versions : français, anglais, japonais...
--> le fichier comporter 3 libellés pour cet objet générique.
Mon fichier comporte tous les libellés de toutes les versions créées mais je ne sais pas comment obtenir uniquement la liste des objets génériques.
Précisions importantes :
- la langue est toujours indiquée à la fin du libellé, mais de manière fantaisiste.
Anglais peut être codé ANG ou GB ou UK ou /ANG ou /GB ou / GB (avec espace entre tiret et GB) etc.
A multiplier par le nombre de langues existant sur Terre...
- il existe des libellés sans langue si un objet n'a pas été décliné selon les langues
Attention : PAQUET DE YAOURTS ne doit pas être considéré comme un paquet de yaourts allemand (pour DEutsch).
PAQUET DE FRAMBOISES ne doit pas être considéré comme un paquet français (FR pour français)
QUelqu'un peut-il m'aider ?
J'ai donc besoin :
1. d'une colonne où les abréviations de langue de chaque libellé disparaissent (s'il y a lieu)
2. de compter le nombre d'objets génériques
Ci-joint un fichier fictif pour mieux visualiser, où figurent 7 objets et 22 libellés
https://www.cjoint.com/?0KBpn2xmlCO
Merci infiniment à toutes les bonnes âmes qui voudront bien m'aider !
J'ai besoin de votre aide pour mon fichier comportant de nombreuses données. Je dois calculer le nombre d'objets génériques qui ont été développés en plusieurs langues.
Ex : j'ai créé un paquet de yaourts A dont l'emballage a été développé en 3 versions : français, anglais, japonais...
--> le fichier comporter 3 libellés pour cet objet générique.
Mon fichier comporte tous les libellés de toutes les versions créées mais je ne sais pas comment obtenir uniquement la liste des objets génériques.
Précisions importantes :
- la langue est toujours indiquée à la fin du libellé, mais de manière fantaisiste.
Anglais peut être codé ANG ou GB ou UK ou /ANG ou /GB ou / GB (avec espace entre tiret et GB) etc.
A multiplier par le nombre de langues existant sur Terre...
- il existe des libellés sans langue si un objet n'a pas été décliné selon les langues
Attention : PAQUET DE YAOURTS ne doit pas être considéré comme un paquet de yaourts allemand (pour DEutsch).
PAQUET DE FRAMBOISES ne doit pas être considéré comme un paquet français (FR pour français)
QUelqu'un peut-il m'aider ?
J'ai donc besoin :
1. d'une colonne où les abréviations de langue de chaque libellé disparaissent (s'il y a lieu)
2. de compter le nombre d'objets génériques
Ci-joint un fichier fictif pour mieux visualiser, où figurent 7 objets et 22 libellés
https://www.cjoint.com/?0KBpn2xmlCO
Merci infiniment à toutes les bonnes âmes qui voudront bien m'aider !
A voir également:
- Extraction d'une chaîne de caractères - abréviations de langues
- Caractères spéciaux - Guide
- Plus de chaine tv - Guide
- Traducteur de langues gratuit - Télécharger - Traduction
- Caracteres speciaux - Guide
- Chaine tnt gratuite sur mobile - Guide
2 réponses
Eh ben !
Habituellement, on se fixe des règles rigoureuses de saisie des données, ce qui permet de les exploiter à loisir et sans erreur.
Ici, tu comptes sur Excel pour repérer toutes les fantaisies et anomales de saisie !
Cela ne va pas être facile ...
Et même si on travaille sur ton fichier exemple pour optimiser les 12 codes de langue, comment feras-tu pour traiter les quelques 80 autres ?
D'autre part, nous pouvons essayer de te débarrasser des abréviations de langue en fin d'intitulé, mais ça ne marchera pas avec les libellés sans langue ... alors il faut sérieusement envisager d'ajouter FR pour ces cas-là ...
On pourrait aussi envisager d'utiliser les filtres d'Excel, mais si ta liste de libellé est trop longue, ça pourrait ne pas marcher ; ton fichier arrive jusqu'à quelle ligne ?
C'est bien, la retraite ! Surtout aux Antilles ... :-)
☻ Raymond ♂
Habituellement, on se fixe des règles rigoureuses de saisie des données, ce qui permet de les exploiter à loisir et sans erreur.
Ici, tu comptes sur Excel pour repérer toutes les fantaisies et anomales de saisie !
Cela ne va pas être facile ...
Et même si on travaille sur ton fichier exemple pour optimiser les 12 codes de langue, comment feras-tu pour traiter les quelques 80 autres ?
D'autre part, nous pouvons essayer de te débarrasser des abréviations de langue en fin d'intitulé, mais ça ne marchera pas avec les libellés sans langue ... alors il faut sérieusement envisager d'ajouter FR pour ces cas-là ...
On pourrait aussi envisager d'utiliser les filtres d'Excel, mais si ta liste de libellé est trop longue, ça pourrait ne pas marcher ; ton fichier arrive jusqu'à quelle ligne ?
C'est bien, la retraite ! Surtout aux Antilles ... :-)
☻ Raymond ♂
Bonjour,
voici une proposition qui permet à excel de savoir ce qu'il doit chercher
donc il y a encore du boulot de traitement pour dé multiplexer-multiplexer les infos.
cette proposition n'est sûrement pas la panacée, mais offre une approche et demande à être remplacée par une macro (qui me rendrait également service)
le lien : http://cjoint.com/?0KEbCwWquiq
à copier (sans espace avant ou après) et coller dans la barre de recherche
quelques explications in situ, mais PAS TESTE sur 26 000 lignes !
car les données de base peuvent subir un traitement par lots
Bonne suite
Cordialement
voici une proposition qui permet à excel de savoir ce qu'il doit chercher
donc il y a encore du boulot de traitement pour dé multiplexer-multiplexer les infos.
cette proposition n'est sûrement pas la panacée, mais offre une approche et demande à être remplacée par une macro (qui me rendrait également service)
le lien : http://cjoint.com/?0KEbCwWquiq
à copier (sans espace avant ou après) et coller dans la barre de recherche
quelques explications in situ, mais PAS TESTE sur 26 000 lignes !
car les données de base peuvent subir un traitement par lots
Bonne suite
Cordialement
Eh oui, j'ai hérité du fichier du service où une quinzaine de personnes entre des données, d'où les fantaisies quant au codage...
Et pour répondre à ta question, le fichier fait 26000 lignes...
Et il faudra mettre un apprenti ou un stagiaire sur le fichier pour harmoniser un peu les codages, car pour le moment ce fichier n'est pas une base de données, mais juste un "foutoir" inexploitable ..