sed trop lent

Question

Bonjour

J'ai deux gros fichiers à comparer (environ 600000 lignes chacun)

$ cat Fichier_A10001001$ cat Fichier_Ba.b.c    toto    1000a.b.c    tata    1001a.b.c    titi      1002

Le but est de trouver que le nombre 1002 (3e champs de la ligne 3 du fichier B) n'est pas présent dans le fichier A.

Alors je prends chaque ligne du Fichier_A que je supprime du Fichier_B. Ainsi à la fin il ne devrait me rester que les lignes en trop dans Fichier_B.

J'ai fais un script avec sed mais c'est trop lent (vraiment très lent) :

#!/bin/bash -xwhile read lignedosed -i '/$ligne/d' Fichier_Bdone < Fichier_A

Comment puis-je faire pour que ça soit traité en moins de 30 jours comme ça semble être le cas avec ce script ?

Merci d'avance

dubcek · Answer

hello
une solution avec awk
$ awk 'NF<2 {t[$1]++; next} !t[$3] {print $3}' fichierA fichierB1002

zipe31 · Answer

Salut,

Une autre méthode à tester :

$ fgrep -v -f fichierA fichierBa.b.c    titi    1002

Sed trop lent

2 réponses

Discussions similaires

Newsletters