Perl-Bash recherche et extraction d'une ligne

[Résolu/Fermé]
Signaler
-
 phoenix1984 -
Bonjour,

je suis débutant en perl ... voici la situation :

je part d'un fichier, ou d'une variable, peut importe ... ce fichier contient plusieurs lignes avec du texte et une valeur ( il s'agit de % d'utilisation et de noms de Filesystem )

ex:

/app 80%
/bin 30%
/toto 25%

je voudrais savoir comment extraire UNIQUEMENT la ligne dont le pourcentage est supérieur à 50% ...

j'arrive à lire un fichier ligne par ligne ... j'arrive à chercher un mot bien précis dans du texte, mais pas à n'extraire qu'une ligne, celle qui contient ce que je cherche ...

Merci de votre aide !!

15 réponses

Messages postés
21331
Date d'inscription
jeudi 4 novembre 2004
Statut
Modérateur, Contributeur sécurité
Dernière intervention
30 octobre 2019
3 554
Salut,

root@debian:~/trash# cat ccm.pl
#!/usr/bin/perl
use strict;use warnings;
while (<DATA>){
        print if /\s[5-9]\d+%/;
}
__END__
/app 80%
/bin 30%
/toto 25%

root@debian:~/trash# perl ccm.pl
/app 80%

2
Merci

Quelques mots de remerciements seront grandement appréciés. Ajouter un commentaire

CCM 42674 internautes nous ont dit merci ce mois-ci

Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020
4 881
Salut,
#! /bin/bash

while read ligne
do
if [ "$(grep -o '[0-9][0-9]*' <<<$ligne)" -ge 50 ]
then echo "$ligne"
fi
done < "$1"
;-))
Messages postés
21331
Date d'inscription
jeudi 4 novembre 2004
Statut
Modérateur, Contributeur sécurité
Dernière intervention
30 octobre 2019
3 554
Salut,

voilà
root@debian:~/trash# cat ccm.pl
#!/usr/bin/perl
use strict;use warnings;
while (<>){
        print if /\s(?:[5-9]\d|\d{3,})%/;
}
__END__
root@debian:~/trash# cat phoenix
/app 80%
/bin 30%
/toto 25%
root@debian:~/trash# perl ccm.pl phoenix
/app 80%
root@debian:~/trash# df -h | perl ccm.pl
/dev/hda1             8,8G  5,4G  3,0G  65% /
/home/jacques/a.iso   571M  571M     0 100% /media/cdrom0
je vais t'expliquer plus tard, j'ai améliorer la regex ;-)
Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020
4 881
Voilà le script modifié :
#! /bin/bash
# Décommenter pour débuguer
#set -xv

while read ligne
do
# On récupère dans une variable le résultat de la commande "grep -o"
#+ "grep -o" ne récupère que le motif correspondant à l'expression régulière mise entre guillemets
#++ dans ton cas, au moins un chiffre (ou plusieurs) suivi(s) du caractère "%"
#+++ le "<<<$variable" est une façon plus simple de lire une variable sur le flux d'entrée
num=$(grep -o '[0-9][0-9]*%' <<<$ligne)
# On compare la valeur de la variable en l'amputant du caractère "%" à l'aide de l'expansion des
#+ variables, voir le man bash à ce sujet 
#++ et on redirige les erreurs dues à une variable vide vers le néant
if [ "${num/\%/}" -ge 50 ] 2>/dev/null
then echo "$ligne"
fi
done < "$1"
;-))
Messages postés
21331
Date d'inscription
jeudi 4 novembre 2004
Statut
Modérateur, Contributeur sécurité
Dernière intervention
30 octobre 2019
3 554
#!/usr/bin/perl
use strict;use warnings;
while (<>){ # cette opérateur permet de lire les lignes
            # des fichiers passer en arguments
  print if /\s(?:[5-9]\d|\d{3,})%/; # affiche seulement les lignes
                                    # qui correspondent à la regex
}
__END__
/\s(?:[5-9]\d|\d{3,})%/

\s - reconnaît un espace
(?: ) permet le regroupement sans capture
1er alternative [5-9]\d
[5-9]\d - trouves toutes les nombre plus grands que 50 jusqu'à 99
[5-9] - c'est une classe de caractères qui permet de reconnaître 5,6,7,8 ou 9
\d - c'est une classe de caractères qui reconnaît les chiffres de 0 à 9
donc on peut la lire comme ça
50
51
.
.
59
60
.
.69
.
.
90
.
.
99


2ème alternative \d{3,}
reconnaît les nombres de minimum 3 chiffres
elle peut être améliorer vu qu'on cherche les nombres plus grand que 100
ce qui donne [1-9]\d{2,} - nous n'avons pas besoin de reconnaître un group de minimum 3 chiffres qui commence avec 0

l'alternative

| - permet de reconnaître soit la partie gauche soit la partie droite de l'alternative

Voici l'exemple avec la regex modifiée
lami20j@debian:~/trash$ cat ccm.pl
#!/usr/bin/perl
use strict;use warnings;
while (<>){
  print if /\s(?:[5-9]\d|[1-9]\d{2,})%/;
}
__END__
lami20j@debian:~/trash$ df -h | perl ccm.pl
/dev/hda7             9,2G  4,6G  4,2G  52% /
/dev/hda8              28G   15G   12G  56% /home
Messages postés
21331
Date d'inscription
jeudi 4 novembre 2004
Statut
Modérateur, Contributeur sécurité
Dernière intervention
30 octobre 2019
3 554
Salut,

if($contenu =~ /(n.*t)/)
{
open(monFile,">../logs/instances/pb_instances.txt");
print monFile"Attention, une instances ne tourne pas :\n $contenu \n";
close(monFile);


Il ne faut pas mettre open à l'intérieur de la boucle while sinon pour chaque ligne contenant not tu auras un appel système assez couteux
Il faut aussi eviter de sauvegarder dans une variable le contenu d'un fichier

tu ouvre le fichier avant la boucle et tu le ferme après
l'écriture tu le fait dans la boucle

Voici une possibilité
open LOG,"../logs/cluster/status_cluster.log"
    or die "E/$ : $!\n";
open MONFILE,">../logs/instances/pb_instances.txt"
    or die "E/S : $!\n"; 

while (<LOG>){
  print MONFILE "Attention, une instances ne tourne pas :\n $contenu \n" if /\bnot\b/;
}
close(monFile); 

Par convention c'est bien d'utiliser les majuscules pour handle de fichier
Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020
4 881
Salut,

Par convention c'est bien d'utiliser les majuscules pour handle de fichier
Quand on manipule trop de langues, on finit par se mélanger les pinceaux ;-DDD

Bonjour,

merci à tous les 2 pour votre réponse si rapide !! c'est super j'ai du bash et du per! les 2 codes fonctionnent nikel !

juste une petite chose :

lami20j => comment faire pour aller lire les infos dans un fichier appart ? là il faut que les infos soient sous le _END_

A vous 2 => pour mon exemple j'ai mis "/app 80%" comme exemple ... mais mon fichier est un résultat d'une commande du genre "df -h" ou "bdf -t nfs" ... là si j'utilise vos codes avec mon fichier de résultat j'ai un message d'erreur ... "expression de type entien attendu" ...

merci de m'éclairer pour ne chercher que la valeur xx % dans la ligne ...

derniere petite chose je ne comprend pas exactement:

"print if /\s[5-9]\d+%/;" & "[ "$(grep -o '[0-9][0-9]*' <<<$ligne)" -ge 50 ]"

et c'est mieux de comprendre merci !! :)

Whaoo !

tout simplement génial la dernière commande ! je l'ai couplé avec un ssh et du coup j'execute le "df -h" sur un poste distant en filtrant avec le fichier perl !! nikel !

par contre je comprend vraiment pas cette ligne : "print if /\s(?:[5-9]\d|\d{3,})%/;" .... c'est là dedans que tu as choisis de filtrer tout ce qui est au dessus de 50% ??

je ne vois pas trop où ( utilie pour faire une modif' ultérieure :)

merci encore !

Un grand merci à lami20j & jipicy !! :)

merci pour les explications détaillées ! je suis d'autant plus content d'avoir 2 réponses ( bash et Perl ) !

J'ai mis vos messages en "Répondent à la question"

vu que cela rentre dans la meme classe, pourriez vous me dire comment faire quelque chose de similaire avec un mot ?

xxx1 is running
xxx2 is running
xxx3 is not running
xxx4 is running
xxx5 is running

J'arrive à faire une recherche de "not" ... mais je n'arrive pas à afficher juste cette ligne ...

mon code :

# Permet d'utiliser des commandes shell .. ici cat .
use Shell qw(cat);

# On entre le contenu du fichier de log dans la variable $contenu
$contenu= cat("../logs/cluster/status_cluster.log");

# Vérification dans $contenu de la présence du mot "not"
if($contenu =~ /(n.*t)/)
{
open(monFile,">../logs/instances/pb_instances.txt");
print monFile"Attention, une instances ne tourne pas :\n $contenu \n";
close(monFile);
.......

merci :)
Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020
4 881
Re-

Pour n'afficher que la ligne contenant "not" tu peux faire avec sed :
sed -n '/not/p' fichier
;-))
Messages postés
21331
Date d'inscription
jeudi 4 novembre 2004
Statut
Modérateur, Contributeur sécurité
Dernière intervention
30 octobre 2019
3 554
Hello,

Quand on manipule trop de langues, on finit par se mélanger les pinceaux
Heureusement qu'on ne manipule pas les pinceaux pour mélanger les langues ;-DDDDDD
Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020
4 881
;-DD

Bonjour,
ok lami20j je ne savais pas pour les pinceaux-langues ... je vais corriger tout ca .. merci pour "sed" et "if /\bnot\b/"

par contre je reviens juste sur ton code "/\s(?:[5-9]\d|\d{3,})%/ ". si je comprend bien, c'est l'alternative \d qui gère les unités de 50 ... autrement dit :

/\s(?:[5-9]\d|\d{3,})%/ pour 50%
/\s(?:[8-9]\d|\d{3,})%/ pour 80%
/\s(?:[1-9]\d|\d{3,})%/ pour 10%

par contre ... comment faire pour filter ce qui dépasse 85% ?

j'ai honte ... mais j'ai testé :

/\s(?:[8-9][5-9] |\d{3,})%/

cela ne fontionne pas trop ...

merci ;)
Messages postés
21331
Date d'inscription
jeudi 4 novembre 2004
Statut
Modérateur, Contributeur sécurité
Dernière intervention
30 octobre 2019
3 554
lami20j@debserv:~/trash$ cat aa
ligne1 80%
ligne2 85%
ligne1 87%%
ligne1 100%
ligne1 10%

lami20j@debserv:~/trash$ perl -ne 'print if /(?:8[5-9]|9[0-9]|[1-9]\d{2,})/' aa
ligne2 85%
ligne1 87%%
ligne1 100%
Cette fois il y a besoin de 3 alternatives

une pour 85 ... 89
une pour 90 ... 99
une pour 100.............

Dans ton exemple [8-9][5-9] ne peux reconnaître que
85 à 89
95 à 99
mais il te manque de 90 à 94
Messages postés
21331
Date d'inscription
jeudi 4 novembre 2004
Statut
Modérateur, Contributeur sécurité
Dernière intervention
30 octobre 2019
3 554
Salut,

voici encore une possibilité plus simple à gérer.
cette fois il s'agit d'une comparaison numérique, tu n'auras qu'à remplacer 85 avec la valeur que tu voudras
lami20j@debserv:~/trash$ cat ccm.pl
#!/usr/bin/perl
use strict;use warnings;

while(<>){
  (my $val) = $_ =~ /\D(\d+)%/;
  next unless $val;
  print if $val >= 85;
}
lami20j@debserv:~/trash$ cat aa
ligne1 80%
ligne2 85%
ligne1 87%%
ligne1 100%
ligne1 10%

lami20j@debserv:~/trash$ perl ccm.pl aa
ligne2 85%
ligne1 87%%
ligne1 100%


Nikel ! encore merci ! :)