Recherche intelligente de combinaison

Stéphane -  
blux Messages postés 27121 Date d'inscription   Statut Modérateur Dernière intervention   -
Bonjour,

qqun aurait-il une solution pour le développement d'une recherche intelligente de combinaison ?

Je m'explique :

ds un fichier j'ai cette structure :

A +
T +
E -
R -
A -
T +
Y +
Z -
Z +
etc ...

avec A-Z le nom des indices et +/- leurs variations. Comment trouver toutes les combinaisons récurantes dans cette liste en fonction du nom des indices et de leurs variations ???

Ex : sur une liste de 5000 indices :
la séquence [A;+] + [T;-] + [F;-] se retrouve 50 fois
la séquence [Y;+] + [Y;-] + [L;+] se retrouve 90 fois
la séquence [C;-] + [E;+] + [Q;-] se retrouve 100 fois
etc...

Avec des séquences pouvant être jouer une fois sur deux, une fois sur 3, BREF tenant compte de toute les possibilités de la liste...

Qqun à une piste ?

Un GRAND merci d'avance
Stéphane

4 réponses

sebsauvage Messages postés 32893 Date d'inscription   Statut Modérateur Dernière intervention   15 662
 
Comment est-ce que tu groupe tes séquences ?
C'est toujours 3 lettres suivies chacunes d'un +/-, toutes les lettres étant mises à la suite dans un fichier texte, c'est ça ?

A +
T +
E -
R -
A -
T +
Y +
Z -
Z +
etc.

à grouper comme ça ?
A +, T +, E -
R -, A -, T +
Y +, Z -, Z +
etc.

et tu cherche le nombre d'occurence de chacun de ces triplet, c'est bien ça ?
0
Stéphane
 
un grand merci pour cette réponse si rapide !!!

- Alors le nom de l'indice (a, b, c, d) n'a peu d'importance et peut très bien se nommer AA, ou B1, l'important c'est de pouvoir localiser les doublons...

- l'ordre de la séquence à une importance

- la subtilité c'est de justement tout prendre en compte ! les séquences consécutives de n élements

ex :
[A, +] [B, -] 500 fois ds la liste
[B, -] [C, +] [A -] 50 fois ds la liste.

OU plus complexe :

[A, +] [B, -] [A, +] [x, x] [x, x] [x, x] [J, +] 20 fois ds la liste

avec [x,x] indice et variation qqonque MAIS se produisant 3 fois entre

[T, +] [A, -] [E, +] [x, x] [I, +] 70 fois ds la liste

avec [x,x] indice et variation qqonque MAIS se produisant 1 fois entre


BREF tenir compte de toutes les combinaisosns possible...

Je ne sais pas si tu as tout compris !! mais en tt k, un grand merci d'avance...

Esteban
0
choubaka Messages postés 39442 Date d'inscription   Statut Modérateur Dernière intervention   2 105
 
salut

ça sent l'algorithme récursif à plein nez tout ça....

Chouba
Casque Bleu forumique
0
sebsauvage Messages postés 32893 Date d'inscription   Statut Modérateur Dernière intervention   15 662
 
ouf... je vois.
Pas évident.

Je me souviens avoir lu dans un vieux Science et Vie un programme capable de repérer les séquences répétitives, mais si tu ajoutes des variations au mileu de chaque séquence, ça devient plus compliqué.

Je n'ai pas de solution toute faite.

Essai toujours ça:
http://www.google.com/search?q=finding+patterns+in+strings

Tu devrais trouver des pistes.
0
blux Messages postés 27121 Date d'inscription   Statut Modérateur Dernière intervention   3 359
 
Salut,

tu pourrais aussi rechercher du côté de la génétique, ça ressemble fichtrement à un séquençage d'ADN... avec 52 bases au lieu de 4 !

A+ Blux "Les cons, ça ose tout.
C'est même à ça qu'on les reconnait"
0