[perl] extraire le texte d'une ligne
Résolu
trepliev
Messages postés
3
Date d'inscription
Statut
Membre
Dernière intervention
-
jipicy Messages postés 40842 Date d'inscription Statut Modérateur Dernière intervention -
jipicy Messages postés 40842 Date d'inscription Statut Modérateur Dernière intervention -
Bonjour,
Je cherche à faire un script qui parse un fichier ligne par ligne et qui, à partir d'une certaine position dans la ligne, extrait le contenu de la ligne pour le mettre dans un autre fichier.
Par exemple, j'ai un fichier qui contient les lignes suivantes:
bla yopyo ahah
pofpofpof pifpif
Je veux qu'à partir de la position (colonne ?) 12, le reste de la ligne soit extraite dans un autre fichier, c'est à dire à partir du a de "ahah" et du p de "pifpif" (les espaces devant compter comme une position).
J'ai réussi à parser le fichier et à extraire son contenu dans un autre, mais je ne sais pas comment gérer cette histoire de position.
J'ai vu des fonctions du genre substr, index, unpack...mais rien qui puisse faire l'affaire.
Une idée ?
Merci d'avance,
Trepliev
Je cherche à faire un script qui parse un fichier ligne par ligne et qui, à partir d'une certaine position dans la ligne, extrait le contenu de la ligne pour le mettre dans un autre fichier.
Par exemple, j'ai un fichier qui contient les lignes suivantes:
bla yopyo ahah
pofpofpof pifpif
Je veux qu'à partir de la position (colonne ?) 12, le reste de la ligne soit extraite dans un autre fichier, c'est à dire à partir du a de "ahah" et du p de "pifpif" (les espaces devant compter comme une position).
J'ai réussi à parser le fichier et à extraire son contenu dans un autre, mais je ne sais pas comment gérer cette histoire de position.
J'ai vu des fonctions du genre substr, index, unpack...mais rien qui puisse faire l'affaire.
Une idée ?
Merci d'avance,
Trepliev
A voir également:
- [perl] extraire le texte d'une ligne
- Extraire une video youtube - Guide
- Extraire le son d'une vidéo - Guide
- Extraire texte d'une image - Guide
- Partager photos en ligne - Guide
- Mètre en ligne - Guide
5 réponses
Ello,
Pour ceux que ça intéresse, j'ai trouvé comment faire ça en perl sans regexp et également avec une commande bash.
En perl:
En bash, on peut utiliser la commande colrm
Par exemple:
En espérant que ça puisse aider ;)
Trepliev
Pour ceux que ça intéresse, j'ai trouvé comment faire ça en perl sans regexp et également avec une commande bash.
En perl:
#! /usr/bin/perl while ($string = <>) { # lecture ligne par ligne du fichier passé en paramètre $extract = substr( $string, 4, 15 ); # extraie le texte à partir du caractère 5 sur les 15 prochains caractères print "$extract\n"; }
En bash, on peut utiliser la commande colrm
Par exemple:
colrm 5 15 < test > resultva supprimer les caractères de 5 à 15 inclus de test et afficher le reste dans result
En espérant que ça puisse aider ;)
Trepliev
Salut,
Et avec "sed" ça te branche pas ?
Et avec "sed" ça te branche pas ?
[tmpfs]$ cat trepliev bla yopyo ahah pofpofpof pifpif [tmpfs]$ sed -n 's/^.\{10\}\(.*\)/\1/w fich.out' trepliev [tmpfs]$ cat fich.out ahah pifpif;-))
Salut et merci pour ta réponse,
Effectivement ça donne le résultat attendu (pourrais-tu d'ailleurs détailler un peu la commande ?)
Le problème c'est que je vais avoir ensuite d'autres traitements sur cette extraction, avec des conditions en fonction de la présence d'un caractère précis à telle ou telle position....c'est pour ça que j'étais parti sur du perl.
Trepliev
Effectivement ça donne le résultat attendu (pourrais-tu d'ailleurs détailler un peu la commande ?)
Le problème c'est que je vais avoir ensuite d'autres traitements sur cette extraction, avec des conditions en fonction de la présence d'un caractère précis à telle ou telle position....c'est pour ça que j'étais parti sur du perl.
Trepliev
-n : demande de ne pas afficher le résultat sur la sortie standard (l'écran)
s : commande de substitution
/ : délimiteur de la commande "s"
^.\{10\}\(.*\) : l'expression rationnelle décomposée comme suit :
^.\{10\} : les 10 premiers caractère (symbolisés par le point ".") depuis le début (^) de la ligne. (Les accolades doivent être protégées (\{ et \}) pour ne pas être interprétées littéralement)
\(.*\) : la sous-expression (entre parenthèses protégées elles aussi pour ne pas être interprétées littéralement) qui matche du 11ème caractère à la fin
/ : délimiteur de la commande "s"
\1 : la référence à la sous-expression (si plusieurs, les références se font par /2 /3 /4 etc. jusqu'à 9).
/ : délimiteur de fin de la commande "s"
w fich.out : le switch "w" (pur write) qui demande l'écriture de la sous-expression dans le fichier de sortie
En résumé : dans la commande de substitution, on demande à récupérer ce qui est matchée par la sous-expression et de l'envoyer dans un fichier de sortie
;-))
s : commande de substitution
/ : délimiteur de la commande "s"
^.\{10\}\(.*\) : l'expression rationnelle décomposée comme suit :
^.\{10\} : les 10 premiers caractère (symbolisés par le point ".") depuis le début (^) de la ligne. (Les accolades doivent être protégées (\{ et \}) pour ne pas être interprétées littéralement)
\(.*\) : la sous-expression (entre parenthèses protégées elles aussi pour ne pas être interprétées littéralement) qui matche du 11ème caractère à la fin
/ : délimiteur de la commande "s"
\1 : la référence à la sous-expression (si plusieurs, les références se font par /2 /3 /4 etc. jusqu'à 9).
/ : délimiteur de fin de la commande "s"
w fich.out : le switch "w" (pur write) qui demande l'écriture de la sous-expression dans le fichier de sortie
En résumé : dans la commande de substitution, on demande à récupérer ce qui est matchée par la sous-expression et de l'envoyer dans un fichier de sortie
;-))
Vous n’avez pas trouvé la réponse que vous recherchez ?
Posez votre question