A voir également:
- Supprimer redondance fichier
- Fichier rar - Guide
- Impossible de supprimer un fichier - Guide
- Fichier host - Guide
- Comment ouvrir un fichier epub ? - Guide
- Comment réduire la taille d'un fichier - Guide
2 réponses
dubcek
Messages postés
18755
Date d'inscription
lundi 15 janvier 2007
Statut
Contributeur
Dernière intervention
14 novembre 2024
5 621
15 févr. 2012 à 10:55
15 févr. 2012 à 10:55
hello
la séquence ATGCGTGAAATGCAT est-elle fixe et de longueur constante, ou ça peut etre n'importe quelle séquence et de longueur variable ?
la séquence ATGCGTGAAATGCAT est-elle fixe et de longueur constante, ou ça peut etre n'importe quelle séquence et de longueur variable ?
dubcek
Messages postés
18755
Date d'inscription
lundi 15 janvier 2007
Statut
Contributeur
Dernière intervention
14 novembre 2024
5 621
Modifié par dubcek le 15/02/2012 à 17:25
Modifié par dubcek le 15/02/2012 à 17:25
Ca marche pour cet exmple en testant les 6 premiers caractères.
A tester plus.
A tester plus.
$ awk '/^>/ {x=$0} /^[A-Z]/ {print $0 , x}' fichier | sort -r | uniq -w 6 | awk '{print $2 "\n" $1}' >pi2 TGCCCTGATAGGGACCAGTAGAC >pi4 TGCATGACTA >pi5 ATGCGTGAAATGCATAT $
zipe31
Messages postés
36402
Date d'inscription
dimanche 7 novembre 2010
Statut
Contributeur
Dernière intervention
27 janvier 2021
6 418
15 févr. 2012 à 17:26
15 févr. 2012 à 17:26
J'avais la même chose avec "sed" mais sur 5 caractères ;-))
$ sed 'N;s/\n/ /' plop | sort -r -k2 | uniq -f 1 -w 5 | sed 's/ /\n/' >pi2 TGCCCTGATAGGGACCAGTAGAC >pi4 TGCATGACTA >pi5 ATGCGTGAAATGCATAT $
15 févr. 2012 à 10:59
Si j'ai bien compris il ne veut garder que l'occurrence la plus longue de chaque séquence présente dans son fichier ;-\
cf son exemple de fichier final (je cite) :
15 févr. 2012 à 11:48
15 févr. 2012 à 16:07
15 févr. 2012 à 17:20
15 févr. 2012 à 17:23