Grep unix

[Résolu/Fermé]
Signaler
Messages postés
765
Date d'inscription
mardi 1 février 2005
Statut
Membre
Dernière intervention
21 septembre 2006
-
 Edi -
Bonjour à toutes et à tous

alors voila je cherche une commande ou une suite de commande (unix) permettant de recherché et d'exclure des chaînes de caractères dans une liste de fichier.
Je m'explique plus en détail et j'expose ce que j'ai déjà fait.

J'ai une serie de fichier a parcourir pour trouver tel ou tel chaîne de caractère (j'utilise donc un bon vieux grep) seuleument dans les lignes que je vais touver je veux en exclure un certains nombre donc : (grep -E 'blablabla|blobloblo' list_file | grep -v -E 'bliblibli|blublublu') jusque la tout va bien on est d'accord mais après je voudrais avoir une sortie de la forme:

nom_file1:nb_occurences_trouvé
nom_file2:nb_occurences_trouvé
nom_file3:nb_occurences_trouvé
nom_file4:nb_occurences_trouvé

donc après quelque bidouille a base de sort uniq et awk je me retrouve avec une ligne de commande:
(grep -E 'blablabla|blobloblo' liste_file | grep -v -E 'bliblibli|blublublu'
| awk '{print $1}' | awk '-F:' '{print $1}' | sort |uniq -c| awk '{print $2 $1}' )
bon j'avoue c'est barbarre mais ça fonctionne seulement il me manque encore une info.
et je sais que ma commande n'est pas capable de ma la donner.

Je voudrais que lorsqu'il y a aucune occurence de la chaine cherché j'ai :
nom_file:0
et ça je vois pas comment faire
j'ai pensé à un truc du style grep -c mais je ne pourrai plus enlever des ligne après avec un grep -v alors je sèche!!!

alors voila si quelqu'un peu m'aider
en éspérant avoir été assez clair n'hesitez pas si vous avez pas compris j'essayerais d'être encore plus explicite

merci d'avance à toutes et à tous et bonne journée

15 réponses

Messages postés
1238
Date d'inscription
lundi 12 septembre 2005
Statut
Contributeur
Dernière intervention
9 décembre 2008
110
Voilà de la doc, je te mets plusieurs chapitres en espérant que tu y trouves les infos que tu recherches :

6.1 Vue d'ensemble.

De nombreux utilitaires emploient les expressions rationnelles pour obtenir une plus grande souplesse lors de la manipulation de textes. La commande grep est un exemple d'utilitaire. Au chapitre 5, nous avons utilisé grep pour localiser de simples séquences de lettres dans un texte. A présent, nous allons effectuer des recherches grâce aux expressions rationnelles.

Dans le chapitre précédent, nous avons vu que le caractère ? pouvait être utilisé comme un motif de remplacement (ou joker) dans la mesure où il remplace n'importe quel caractère. Ce motif de remplacement fonctionne avec les noms de fichiers. Dans le cas des expressions rationnelles, le motif de remplacement est . . Aussi, pouvez-vous utiliser la commande grep .3....8 <fichier> pour trouver les numéros de téléphone à 7 chiffres, recherchés dans l'exemple décrit dans l'introduction au présent chapitre.

Les expressions rationnelles sont employées pour effectuer une recherche ligne-par-ligne. Par exemple, si les 7 caractères sont répartis en deux lignes (c'est-à-dire qu'il y a un saut de ligne au milieu), grep ne pourra pas trouver le numéro correspondant à l'expression rationnelle qui lui est passée. En général, un programme qui utilise des expressions rationnelles opère ses recherches une ligne à la fois.

Ci-dessous, se trouvent quelques expressions rationnelles qui constituent une base essentielle. Nous utilisons les commandes grep et egrep pour illustrer l'utilisation des expressions rationnelles (rappelez-vous que l'option -w vaut pour les mots, seulement). Les expressions sont insérées entre des guillemets simples ' ' pour des raisons qui seront expliquées plus tard. [NdT: la recherche de mots anglais a été conservée comme dans le document original.]

grep -w 't[a-i]e'
détecte les mots tee, the et tie. Les crochets ont une signification spéciale. Ils stipulent que la recherche se fera sur un caractère allant de a à i.

grep -w 't[i-z]e'
détecte les mots tie et toe.

grep -w 'cr[a-m]*t'
détecte les mots craft, credit et criquet. Le signe * désigne n'importe quel nombre de caractères parmi ceux cités entre crochets. En l'occurrence, il s'agit de la gamme de caractères allant de a à m.

grep -w 'kr.*n'
détecte les mots kremlin et krypton. Le signe . signifie ``tout caractère'', et le signe * signifie ``un nombre quelconque de fois''.

egrep -w '(th | sh).*rt'
détecte les mots shirt, short et thwart. Le signe | signifie qu'il faut rechercher les correspondances sur th ou sh. egrep se comporte comme grep mais pour des extended regular expressions qui permettent donc l'usage de |. [Le caractère | est un opérateur logique OU (en anglais: OR) qui permet la sélection de ce qui se trouve à gauche ou à droite de |. Ceci est également vrai dans plusieurs langages de programmation]. Notez d'une part, que les crochets indiquent une recherche sur un caractère parmi plusieurs et d'autre part, que les parenthèses sont utilisées avec l'opérateur logique | qui permet la recherche sur un mot parmi plusieurs.

grep -w 'thr[aeiou]*t'
extrait les lignes contenant les mots thread et throat. Une liste de caractères possibles peut se retrouver entre crochets.

grep -w 'thr[^a-f]*t'
sélectionne les lignes contenant les mots throughput et throat. Le signe ^ après le crochet gauche indique que la recherche porte sur tous les caractères sauf ceux qui vont de a à f. Par exemple, le mot thrift ne sera pas détecté puisqu'il contient un f.

Toutes les expressions rationnelles décrites ci-dessus permettent de rechercher des mots (en raison de l'option -w). Si l'option -w n'est pas présente, elles trouveront des correspondances sur des parties de mot, ce qui contribuera à augmenter le nombre de correspondances. Notez également que le signe * signifie ``tout nombre de caractère'', y compris ``pas de caractère''. Par exemple, t[a-i]*e pourrait détecter la séquence te, soit un t et un e sans aucun caractère entre eux.

Le plus souvent, vous utiliserez des expressions rationnelles qui effectuent des recherches sur les lignes entières. Parfois, vous préférerez détecter une ligne qui commence ou se termine par une chaîne donnée. Le caractère ^ spécifie le début d'une ligne et $ la fin. Par exemple, ^The détecte les lignes débutant par The et hack$ les lignes se terminant par hack. Par ailleurs, '^*The.*hack$' extrait les lignes de texte qui commencent par The et se finissent par hack, même si un caractère blanc est présent au début ou à la fin de la ligne. Parce que les expressions rationnelles utilisent des caractères spéciaux (. \ [ ] * + ?), ces derniers ne peuvent être utilisés directement. Cette restriction vous limite sévèrement pour la recherche de caractères tel que . , disons. Pour détecter correctement un caractère . , il convient d'utiliser la séquence \. forçant l'interprétation sur . qui, en conséquence ne sera plus considéré comme un caractère de remplacement. Donc, l'expression rationnelle monfichier.txt pourrait correspondre à monfichiertxt et à monfichier.txt. Cependant, l'expression rationnelle monfichier\.txt ne correspond qu'à monfichier.txt.

Vous pouvez utiliser la plupart des caractères spéciaux en les faisant précéder du signe backslash \ . Par exemple, vous utiliserez \[ pour détecter le caractère réel [, ainsi que \$ pour le caractère $, l'expression \\ pour \, \+ pour + et l'expression \? pour le caractère réel ? (l'usage de ? et + est expliqué ci-dessous).


6.2 La commande fgrep.

fgrep est une alternative à grep. La différence est que grep (la commande la plus utilisée) fonctionne avec des expressions rationnelles alors que fgrep recherche des chaînes littérales. En d'autres termes, vous pouvez utiliser fgrep lorsque vous désirez rechercher des chaînes ordinaires qui ne forment pas des expressions rationnelles. Cela évite l'usage du caractère d'échappement \.

6.3 Notation \{\} des expressions rationnelles.

x* permet de rechercher le caractère x de 0 à une infinité d'occurrence. Vous pouvez spécifier d'autres gammes de nombres, par exemple avec x\{3,5\} qui recherche au moins 3 mais pas plus de 5 x, c'est-à-dire, xxx, xxxx et xxxxx.

Si vous recherchez xxxx exactement, vous pouvez employer x\{4\}. Notez que x\{7,\} recherchera 7 x au moins. Ici, la borne supérieure n'est pas mentionnée.

Comme dans tous exemples précités, le caractère x peut être remplacé par une gamme de caractères (comme, par exemple, [a-k]):

grep -w 'th[a-t]\{2,3\}t'
détecte les mots theft, thirst, threat, thrift et throat.

grep -w 'th[a-t]\{4,5\}t'
détecte les mots theorist, thicket et thinnest.


6.4 Expressions rationnelles étendues + ? \<\> () | -- notation avec egrep.

Une version améliorée des expressions rationnelles permet quelques facilités qui provoqueraient des conflits avec grep mais pas avec egrep:

+
est analogue à \{1,\}. Il agit comme * mais détecte un caractère ou plus au lieu de zéro caractère ou plus.

?
est analogue à ``-1''. Il détecte zéro ou un caractère.

\< \>
peut entourer plusieurs chaînes séparées par l'opérateur | . (Seulement pour egrep).

\( \)
peut entourer plusieurs chaînes séparées par \|. (Seulement pour grep).

Les exemples suivants devraient rendre ces deux dernières notations plus claires:

grep 'trot'
détecte les mots electrotherapist, betroth et ainsi de suite mais,

grep '\<trot\>'
détecte seulement trot.

egrep -w '(this|that|c[aeiou])*t'
détecte les mots this, that, cot, coat, cat et cut.

6.5 Sous-expressions d'expressions rationnelles.

Les sous-expressions sont étudiées au chapitre 9.

Si des fois, il te fallait voir ce qu'il y a dans ce chap9, signale-le.
4
Merci

Quelques mots de remerciements seront grandement appréciés. Ajouter un commentaire

CCM 41713 internautes nous ont dit merci ce mois-ci

Messages postés
765
Date d'inscription
mardi 1 février 2005
Statut
Membre
Dernière intervention
21 septembre 2006
87
merci pour cette aide
mais ça ne m'aide pas
je ne vois toujours pas comment faire!
merci quand même
Merci pour le tuto. Super!
Messages postés
13087
Date d'inscription
lundi 28 janvier 2002
Statut
Webmaster
Dernière intervention
11 septembre 2021
418
Pour Balou311, même si c'est un peu tard,
for file in grep?; do
echo $file":"$(grep -E 'blablabla|blobloblo' $file |grep -v -E 'bliblibli|blublublu'|wc -l)
done
Je me suis basé sur des fichier de tests se nommant grep0 à grep9, d'ou le grep? dans le for, a toi de le modifier pour adapter...

Pour xavyeii:
grep MemTotal /proc/meminfo|sed 's/MemTotal:\s\+//'

grep truc fichier | awk '{if .... print $1 else print cequetuveux ......}'
Messages postés
765
Date d'inscription
mardi 1 février 2005
Statut
Membre
Dernière intervention
21 septembre 2006
87
j'y ai pensé le problème c'est que le grep truc fichier (fichier: est en fait une suite de fichier) ne me donnera pas les fichiers ne contenant pas truc il me donnera juste =>fichier:ligne_contenant_truc<=
ou alors je ne sais pas comment le faire

en tout cas merci pour ta réponse
Bonjour,

je tourne sous un kernel Unix (version Mac OS X) et je souhaitais balayer l'un de mes répertoires de fichiers php en utilisant une commande grep, mais j'ai eu un message d'erreur: """grep: unknown directories method"""

voici ma ligne de commande: grep -d agenda path

(je recherchais le mot "path" dans tous les fichiers du repertoire "agenda".)

apparemment, l'erreur ne viens pas du fait que j'utilise le mot path (d'après ce que conclut le message d'erreur).

peut-être dois-je mettre -R en plus car il y'a des sous répertoires il me semble.

sinon, ............. man est mon ami !!
Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020
4 887
Salut,

Utilises plutôt la commande "find" couplée à "grep", un truc du style :
find /chemin/agenda -type f -name "*" -exec grep -H "path" {} \;
;-))
Bonjour,

hum.. je cherche comment faire pour n'avoir que la taille de la mémoire totale:
grep MemTotal /proc/meminfo

Là il m'affiche : "MemTotal: 385564 kB"
Et je voudrais qu'il m'affiche seulement cela: "385564 kB"

Merci par avance,

Xavier
Génial Merci beaucoup asevere !!
Messages postés
21331
Date d'inscription
jeudi 4 novembre 2004
Statut
Modérateur, Contributeur sécurité
Dernière intervention
30 octobre 2019
3 561
Salut,

ça ne marche pas avec cut ?
grep MemTotal  | cut -d':' -f2
--
106485010510997108
Messages postés
13087
Date d'inscription
lundi 28 janvier 2002
Statut
Webmaster
Dernière intervention
11 septembre 2021
418
Si aussi, et c'est plus simple :-)

Par contre, ça laisse des espaces devant selon les configurations...
Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020
4 887 >
Messages postés
13087
Date d'inscription
lundi 28 janvier 2002
Statut
Webmaster
Dernière intervention
11 septembre 2021

sed -n '/MemTotal: */ s///p' /proc/meminfo
;-))
Messages postés
13087
Date d'inscription
lundi 28 janvier 2002
Statut
Webmaster
Dernière intervention
11 septembre 2021
418 >
Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020

Ha ben voui, bien vu
ça marche tout aussi bien ! =)
Merci

Autre question:

J'ai fait la commande suivante:
echo -e "===> /etc/fstab \n\n" $(cat /etc/fstab) >> AC000021.txt

J'aimerais que cela soit afficher de la manière suivante:
===> /etc/fstab

/dev/vg_sys/...
/dev/vg_sys/...
/dev/vg_app/..
...

Or ça s'affiche comme suit:
===> /etc/fstab

/dev/vg_sys/... /dev/vg_sys/... /dev/vg_app/.. ...


En gros, comment mettre à la ligne avant tous les
/dev
?

Merci par avance
Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020
4 887
 echo -e "===> /etc/fstab \n\n" && cat /etc/fstab  >> AC000021.txt
;-))
Yes ! C'est parfait !

(enfin presque..)

Le problème est qu'il ne m'affiche plus "====> /etc/fstab :" dans le fichier

=(
Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020
4 887
Oups ;-((
(echo -e "===> /etc/fstab \n\n" && cat /etc/fstab)  >> AC000021.txt
Désolé ;-)
Messages postés
13087
Date d'inscription
lundi 28 janvier 2002
Statut
Webmaster
Dernière intervention
11 septembre 2021
418 >
Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020

Hum,

Puisque qu'on est dans les commandes courtes...
 sed '1i===>/ets/fstab\n\n' /etc/fstab >> fichier_resultant
Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020
4 887 >
Messages postés
13087
Date d'inscription
lundi 28 janvier 2002
Statut
Webmaster
Dernière intervention
11 septembre 2021

Ben voui ;-))

Mais bon, /ets j'ai pas trouvé comme répertoire ;-DDDD
Messages postés
21331
Date d'inscription
jeudi 4 novembre 2004
Statut
Modérateur, Contributeur sécurité
Dernière intervention
30 octobre 2019
3 561 >
Messages postés
40805
Date d'inscription
jeudi 28 août 2003
Statut
Modérateur
Dernière intervention
10 août 2020

c'est normal, puisque tu n''as pas des pages pour woman ;-DDD
Hum.. je pensais l'avoir déjà testé ça ...

Mais bon Merci beaucoup ça marche ;)
Par contre le tiens asevere ne marche pas chez moi =/
Messages postés
13087
Date d'inscription
lundi 28 janvier 2002
Statut
Webmaster
Dernière intervention
11 septembre 2021
418
A tout hasard, c'est un(le chiffre) puis i dans la commande sed
Hum .. ouép =)
Désolé je débute... je ne sais même pas comment comprendre ce bout de code =/
enfin je ne sais pas ce que veut dire "1i" ...
Messages postés
13087
Date d'inscription
lundi 28 janvier 2002
Statut
Webmaster
Dernière intervention
11 septembre 2021
418
Autant pour moi, voici l'explication:
sed '1i===>/etc/fstab\n\n' /etc/fstab >> fichier_resultant


inserer avant la 1ere ligne du fichier /etc/fstab la chaine "===>/etc/fstab" puis deux retours chariots (\n\n)

OK merci !

Et qu'est-ce qui fait les retours à la ligne avant chaque "/dev" (et encore il y a des lignes qui n'ont même pas de "/dev" au début) ? C'est spécifique au fichier ?
Messages postés
13087
Date d'inscription
lundi 28 janvier 2002
Statut
Webmaster
Dernière intervention
11 septembre 2021
418
C'est le fichier lui même qui est formaté comme ça ;-)
Messages postés
13087
Date d'inscription
lundi 28 janvier 2002
Statut
Webmaster
Dernière intervention
11 septembre 2021
418 >
Messages postés
13087
Date d'inscription
lundi 28 janvier 2002
Statut
Webmaster
Dernière intervention
11 septembre 2021

echo $(cat fichier) va prendre tout les 'mots' du fichier et les afficher, il faut dans ce cas, (pour signaler a echo que le contenu du fichier n'est qu'un seul argument) entourer $(cat fichier) par des guillemets doubles

tu le verras en faisant:
echo $(cat /etc/fstab)       #une ligne est renvoyée
echo "$(cat /etc/fstab)"     #autant de ligne qu'il y a dans /etc/fstab sont renvoyée
C'est un peu simplifié, mais c'est comme ça qu'il faut le comprendre dans un premier temps...
D'accord ! Mais dans pourquoi alors en l'écrivant comme suit ça fait la même chose:

echo -e "====> /etc/fstab : \n\n" && cat /etc/fstab


C'est le && cela ?

Merci pour tes réponses en tout cas =)
Je continuerai demain pour moi..

xav