Séries de chiffres à comparer sur excel

Résolu/Fermé
CaroB - 28 avril 2012 à 11:06
 CaroB - 1 mai 2012 à 11:09
Bonjour,

J'ai 100 séries de chiffres à comparer sur excel (100 lignes de 52 chiffres) : je souhaiterais savoir quelles séries sont identiques entre elles et lesquelles sont différentes (avec si possible le nombre de chiffres différents).
Est-ce que quelqu'un saurait comment faire?

Merci par avance

CaroB

A voir également:

8 réponses

Merci pour vos réponses,
Ce sont bien des chiffres (0 à 4 uniquement). Ils sont dans 52 colonnes.
Je ne trouve pas comment télécharger le fichier ici, mais en gros, ça donne une série comme ça pour chacun des échantillons (j'ai fait un copier coller d'une ligne) :
0 0 1 1 0 0 1 1 1 0 0 1 0 0 1 0 0 0 0 0 0 1 0 1 0 1 0 0 1 1 0 4 1 0 1 1 0 0 0 0 0 1 0 1 0 0 0 0 1 1 1 1
Le mieux serait que j'arrive à représenter les différences entre chaque série par un sorte de graphique... Je sais que c'est complexe... Et d'après mes premières investigations, il semblerait que j'ai 75 séries différentes (sur le total des 100), dont certaines qui seraient très proches avec uniquement 1 ou 2 différences.
Mon problème est maintenant de pouvoir exprimer ces résultats clairement...
1
Patrice33740 Messages postés 8556 Date d'inscription dimanche 13 juin 2010 Statut Membre Dernière intervention 2 mars 2023 1 776
28 avril 2012 à 12:02
Pour trouver les valeurs identiques entre elles, il suffit d'utiliser :
=NB.SI(A1:A100;A1)
Lorsque le résultat est supérieur à 1 c'est que d'autre valeurs sont identiques,
et La Palisse aurait dit que celles qui ne sont pas identiques sont différentes !

Pour connaitre le nombre de chiffres différents il suffit de décomposer le texte en 52 colonnes mais encore faudrait-t-il savoir par rapport a quoi s'effectue le comptage !
0
Raymond PENTIER Messages postés 58396 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 25 avril 2024 17 094
29 avril 2012 à 03:36
Bonjour CaroB.

Envoie un extrait de ton fichier, car ton explication manque cruellement de précision :
* S'agit-il bien de chiffres, et pas de nombres ?
* Comment sont-ils écrits : dans 52 colonnes ?
* Les 52 dans une seule cellule ?
*-* Collés (86540241897541234 ...) ?
*-* Séparés ?
*-*-* Par un espace ? un point-virgule ? un tiret ?

Si aucune des 100 séries n'est identique à aucune autre, tu sais qu'il te faudrait 4950 réponses (listes des différences entre 2 séries) ?
0
Raymond PENTIER Messages postés 58396 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 25 avril 2024 17 094
29 avril 2012 à 19:00
Alors voyons : Si deux listes sont identiques, la somme des 52 chiffres est identique ; nous allons aussi compter le nombre de 0, de 1, de 2, de 3 et de 4.
Donc dans la 54ème colonne on fait l'addition des 53 premières (la colonne A contient l'indicatif de la série) =SOMME(B2:AZ2)
En BB1:BF1 on place les 5 chiffres utilisés (de 0 à 4).
Dans la cellule BB2 on saisit la formule =NB.SI($B2:$AZ2;$1:$1)
qu'on recopie dans la plage BB2:BF101.

Le problème est à moitié résolu : Si deux lignes ont exactement les mêmes résultats dans les colonnes BA à BF, il y a 90% de chances pour qu'elles soient identiques (tu n'as pas précisé si l'ordre des chiffres devait aussi être respecté ...).

https://www.cjoint.com/?BDDs7ELIV5Y
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
Raymond PENTIER Messages postés 58396 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 25 avril 2024 17 094
29 avril 2012 à 19:44
... suite
On utilisera :
* la colonne BH pour voir si la somme trouvée en BA se retrouve plusieurs fois =NB.SI(BA$2:BA$11;BA2)
* les colonnes BI à BM pour compter combien de fois l'un des 5 chiffres utilisés est inscrit dans la série
* la colonne BN pour faire une opération fantaisiste à partir des 5 résultats précédents, par exemple =SI(BH2=1;"#";SOMME(BI2:BM2)*PRODUIT(BI2:BM2))
* la colonne BO pour en tirer la conclusion finale
=SI(ET(ESTNUM(BN2);NB.SI($BN$2:$BN$11;BN2)>1);"doublon";"unique")
https://www.cjoint.com/?BDDtPJePQlY
Mais il y a certainement plus simple !
0
Merci beaucoup pour ces formules astucieuses! Mais en effet, l'ordre des chiffres doit aussi être respecté... Je m'excuse de ne pas avoir précisé ce détail plus tôt, il a en effet son importance.
Si vous avez une autre idée, je suis preneuse, sinon, cette version me sera déjà très utile!

Encore merci!
0
Bonjour,

Une proposition à simplifier grandement, par les bons soins des matheux :

http://cjoint.com/?3DEaTNe7DHj

Cordialement
axion
0
modificatif au post ci-dessus

la fonction SOUS.TOTAL fait très bien l'affaire, par "glissement" sur une demi-longueur de ligne :
soit une ligne de chiffres de la col A à la col AZ
=SOUS.TOTAL(1;A3:Z3;B3:AA3;C3:AB3;D3:AC3;.... ainsi de suite jusqu'à...AA3:AZ3)
à tirer vers le bas
(testé en plus court)
la colonne SOUS.TOTAL reçoit une MFC pour marquer en couleur les unitaires.
(d° post précédent)

nouveau lien : http://cjoint.com/?BDEdomnw6vf

Bonne continuation
axion
0
Raymond PENTIER Messages postés 58396 Date d'inscription lundi 13 août 2007 Statut Contributeur Dernière intervention 25 avril 2024 17 094
30 avril 2012 à 04:07
Salut à vous tous.

Finalement je me sens assez stupide, car il y a une solution directe : Les données de la première série étant en B2:BA2, saisir en BB2 la formule (longue mais simple)
=CONCATENER(B2;C2;D2;E2;F2;G2;H2;I2;J2;K2;L2;M2;N2;O2;P2;Q2;R2;S2; T2;U2;V2;W2;X2;Y2;Z2;AA2;AB2;AC2;AD2;AE2;AF2;AG2;AH2;AI2;AJ2;AK2; AL2;AM2;AN2;AO2;AP2;AQ2;AR2;AS2;AT2;AU2;AV2;AW2;AX2;AY2;AZ2;BA2)
et en BC2 la formule =SI(NB.SI($BB$2:$BB$11;BB2)>1;"Doublon";"unique")
puis les recopier vers le bas.
Tout bêtement !
https://www.cjoint.com/?BDEebBZBEWr
0
Patrice33740 Messages postés 8556 Date d'inscription dimanche 13 juin 2010 Statut Membre Dernière intervention 2 mars 2023 1 776
30 avril 2012 à 09:01
Bonjour Raymond,

Finalement, l'énoncé d'origine laissant penser qu'il n'y avait qu'une colonne, c'est ce que j'avais suggéré !

Cordialement
Patrice
0
Bonjour le fil

ma version d'excel 2010, compatible 97-2003 ne prend en compte que les 15 premiers chiffres
dans la fonction NB.SI
d'où une disparité des résultats si un 16eme chiffre d'une liste (col P et suivantes) venait à être différent

un lien : http://cjoint.com/?BDEldgPhX1u

Une solution ?
Cordialement
axion
0
Patrice33740 Messages postés 8556 Date d'inscription dimanche 13 juin 2010 Statut Membre Dernière intervention 2 mars 2023 1 776
30 avril 2012 à 15:12
Excel ne prend en compte que les 15 premiers chiffres d'un nombre mais il prend en compte tous les chiffres d'un texte (de 52 chiffres par exemple) et donc NB.SI fonctionne bien dans ce dernier cas.
0
Bonjour, Patrice

je viens de finaliser une proposition ci jointe :
http://cjoint.com/?BDEpoHgdMF9
avec la fonction NB.SI en complément de SOUS.TOTAL par sécurité obligatoire.
toutefois, dans la proposition CONCATENER et NB.SI, les modifs intervenant en col P, Q... ou X
ne sont pas prises en compte (sauf si un nombre dépassant 9 y est saisi)
puisque NB.SI calcule sur la colonne concaténée

Je ne sais pas si tu obtiens le même souci sur ton programme, mais ici, il persiste.
Merci de ton avis
Cordialement
axion
0
Patrice33740 Messages postés 8556 Date d'inscription dimanche 13 juin 2010 Statut Membre Dernière intervention 2 mars 2023 1 776
30 avril 2012 à 22:34
Effectivement, lorsque la chaine de caractères ne comprend que des chiffres, seuls les 15 premiers sont pris en compte. Cependant, la méthode du concaténer associée au NB.SI reste la meilleure, il suffit d'ajouter à la série concaténée un caractère non numérique (par exemple @) au début ou à la fin.

Avec la moyenne (sous.total), c'est moins rigoureux, par exemple si tu inverse le premier et le dernier chiffre d'une série tu obtiens la même moyenne

Cordialement
Patrice
0