Séries de chiffres à comparer sur excel
Résolu
CaroB
-
CaroB -
CaroB -
Bonjour,
J'ai 100 séries de chiffres à comparer sur excel (100 lignes de 52 chiffres) : je souhaiterais savoir quelles séries sont identiques entre elles et lesquelles sont différentes (avec si possible le nombre de chiffres différents).
Est-ce que quelqu'un saurait comment faire?
Merci par avance
CaroB
J'ai 100 séries de chiffres à comparer sur excel (100 lignes de 52 chiffres) : je souhaiterais savoir quelles séries sont identiques entre elles et lesquelles sont différentes (avec si possible le nombre de chiffres différents).
Est-ce que quelqu'un saurait comment faire?
Merci par avance
CaroB
A voir également:
- Séries de chiffres à comparer sur excel
- Excel trier par ordre croissant chiffre - Guide
- Liste déroulante excel - Guide
- Telecharger macro convertir chiffre en lettre excel - Télécharger - Tableur
- Word et excel gratuit - Guide
- Comment calculer la moyenne sur excel - Guide
8 réponses
Merci pour vos réponses,
Ce sont bien des chiffres (0 à 4 uniquement). Ils sont dans 52 colonnes.
Je ne trouve pas comment télécharger le fichier ici, mais en gros, ça donne une série comme ça pour chacun des échantillons (j'ai fait un copier coller d'une ligne) :
0 0 1 1 0 0 1 1 1 0 0 1 0 0 1 0 0 0 0 0 0 1 0 1 0 1 0 0 1 1 0 4 1 0 1 1 0 0 0 0 0 1 0 1 0 0 0 0 1 1 1 1
Le mieux serait que j'arrive à représenter les différences entre chaque série par un sorte de graphique... Je sais que c'est complexe... Et d'après mes premières investigations, il semblerait que j'ai 75 séries différentes (sur le total des 100), dont certaines qui seraient très proches avec uniquement 1 ou 2 différences.
Mon problème est maintenant de pouvoir exprimer ces résultats clairement...
Ce sont bien des chiffres (0 à 4 uniquement). Ils sont dans 52 colonnes.
Je ne trouve pas comment télécharger le fichier ici, mais en gros, ça donne une série comme ça pour chacun des échantillons (j'ai fait un copier coller d'une ligne) :
0 0 1 1 0 0 1 1 1 0 0 1 0 0 1 0 0 0 0 0 0 1 0 1 0 1 0 0 1 1 0 4 1 0 1 1 0 0 0 0 0 1 0 1 0 0 0 0 1 1 1 1
Le mieux serait que j'arrive à représenter les différences entre chaque série par un sorte de graphique... Je sais que c'est complexe... Et d'après mes premières investigations, il semblerait que j'ai 75 séries différentes (sur le total des 100), dont certaines qui seraient très proches avec uniquement 1 ou 2 différences.
Mon problème est maintenant de pouvoir exprimer ces résultats clairement...
Pour trouver les valeurs identiques entre elles, il suffit d'utiliser :
=NB.SI(A1:A100;A1)
Lorsque le résultat est supérieur à 1 c'est que d'autre valeurs sont identiques,
et La Palisse aurait dit que celles qui ne sont pas identiques sont différentes !
Pour connaitre le nombre de chiffres différents il suffit de décomposer le texte en 52 colonnes mais encore faudrait-t-il savoir par rapport a quoi s'effectue le comptage !
=NB.SI(A1:A100;A1)
Lorsque le résultat est supérieur à 1 c'est que d'autre valeurs sont identiques,
et La Palisse aurait dit que celles qui ne sont pas identiques sont différentes !
Pour connaitre le nombre de chiffres différents il suffit de décomposer le texte en 52 colonnes mais encore faudrait-t-il savoir par rapport a quoi s'effectue le comptage !
Bonjour CaroB.
Envoie un extrait de ton fichier, car ton explication manque cruellement de précision :
* S'agit-il bien de chiffres, et pas de nombres ?
* Comment sont-ils écrits : dans 52 colonnes ?
* Les 52 dans une seule cellule ?
*-* Collés (86540241897541234 ...) ?
*-* Séparés ?
*-*-* Par un espace ? un point-virgule ? un tiret ?
Si aucune des 100 séries n'est identique à aucune autre, tu sais qu'il te faudrait 4950 réponses (listes des différences entre 2 séries) ?
Envoie un extrait de ton fichier, car ton explication manque cruellement de précision :
* S'agit-il bien de chiffres, et pas de nombres ?
* Comment sont-ils écrits : dans 52 colonnes ?
* Les 52 dans une seule cellule ?
*-* Collés (86540241897541234 ...) ?
*-* Séparés ?
*-*-* Par un espace ? un point-virgule ? un tiret ?
Si aucune des 100 séries n'est identique à aucune autre, tu sais qu'il te faudrait 4950 réponses (listes des différences entre 2 séries) ?
Alors voyons : Si deux listes sont identiques, la somme des 52 chiffres est identique ; nous allons aussi compter le nombre de 0, de 1, de 2, de 3 et de 4.
Donc dans la 54ème colonne on fait l'addition des 53 premières (la colonne A contient l'indicatif de la série) =SOMME(B2:AZ2)
En BB1:BF1 on place les 5 chiffres utilisés (de 0 à 4).
Dans la cellule BB2 on saisit la formule =NB.SI($B2:$AZ2;$1:$1)
qu'on recopie dans la plage BB2:BF101.
Le problème est à moitié résolu : Si deux lignes ont exactement les mêmes résultats dans les colonnes BA à BF, il y a 90% de chances pour qu'elles soient identiques (tu n'as pas précisé si l'ordre des chiffres devait aussi être respecté ...).
https://www.cjoint.com/?BDDs7ELIV5Y
Donc dans la 54ème colonne on fait l'addition des 53 premières (la colonne A contient l'indicatif de la série) =SOMME(B2:AZ2)
En BB1:BF1 on place les 5 chiffres utilisés (de 0 à 4).
Dans la cellule BB2 on saisit la formule =NB.SI($B2:$AZ2;$1:$1)
qu'on recopie dans la plage BB2:BF101.
Le problème est à moitié résolu : Si deux lignes ont exactement les mêmes résultats dans les colonnes BA à BF, il y a 90% de chances pour qu'elles soient identiques (tu n'as pas précisé si l'ordre des chiffres devait aussi être respecté ...).
https://www.cjoint.com/?BDDs7ELIV5Y
Vous n’avez pas trouvé la réponse que vous recherchez ?
Posez votre question
... suite
On utilisera :
* la colonne BH pour voir si la somme trouvée en BA se retrouve plusieurs fois =NB.SI(BA$2:BA$11;BA2)
* les colonnes BI à BM pour compter combien de fois l'un des 5 chiffres utilisés est inscrit dans la série
* la colonne BN pour faire une opération fantaisiste à partir des 5 résultats précédents, par exemple =SI(BH2=1;"#";SOMME(BI2:BM2)*PRODUIT(BI2:BM2))
* la colonne BO pour en tirer la conclusion finale
=SI(ET(ESTNUM(BN2);NB.SI($BN$2:$BN$11;BN2)>1);"doublon";"unique")
https://www.cjoint.com/?BDDtPJePQlY
Mais il y a certainement plus simple !
On utilisera :
* la colonne BH pour voir si la somme trouvée en BA se retrouve plusieurs fois =NB.SI(BA$2:BA$11;BA2)
* les colonnes BI à BM pour compter combien de fois l'un des 5 chiffres utilisés est inscrit dans la série
* la colonne BN pour faire une opération fantaisiste à partir des 5 résultats précédents, par exemple =SI(BH2=1;"#";SOMME(BI2:BM2)*PRODUIT(BI2:BM2))
* la colonne BO pour en tirer la conclusion finale
=SI(ET(ESTNUM(BN2);NB.SI($BN$2:$BN$11;BN2)>1);"doublon";"unique")
https://www.cjoint.com/?BDDtPJePQlY
Mais il y a certainement plus simple !
Merci beaucoup pour ces formules astucieuses! Mais en effet, l'ordre des chiffres doit aussi être respecté... Je m'excuse de ne pas avoir précisé ce détail plus tôt, il a en effet son importance.
Si vous avez une autre idée, je suis preneuse, sinon, cette version me sera déjà très utile!
Encore merci!
Si vous avez une autre idée, je suis preneuse, sinon, cette version me sera déjà très utile!
Encore merci!
Bonjour,
Une proposition à simplifier grandement, par les bons soins des matheux :
http://cjoint.com/?3DEaTNe7DHj
Cordialement
axion
Une proposition à simplifier grandement, par les bons soins des matheux :
http://cjoint.com/?3DEaTNe7DHj
Cordialement
axion
modificatif au post ci-dessus
la fonction SOUS.TOTAL fait très bien l'affaire, par "glissement" sur une demi-longueur de ligne :
soit une ligne de chiffres de la col A à la col AZ
=SOUS.TOTAL(1;A3:Z3;B3:AA3;C3:AB3;D3:AC3;.... ainsi de suite jusqu'à...AA3:AZ3)
à tirer vers le bas
(testé en plus court)
la colonne SOUS.TOTAL reçoit une MFC pour marquer en couleur les unitaires.
(d° post précédent)
nouveau lien : http://cjoint.com/?BDEdomnw6vf
Bonne continuation
axion
la fonction SOUS.TOTAL fait très bien l'affaire, par "glissement" sur une demi-longueur de ligne :
soit une ligne de chiffres de la col A à la col AZ
=SOUS.TOTAL(1;A3:Z3;B3:AA3;C3:AB3;D3:AC3;.... ainsi de suite jusqu'à...AA3:AZ3)
à tirer vers le bas
(testé en plus court)
la colonne SOUS.TOTAL reçoit une MFC pour marquer en couleur les unitaires.
(d° post précédent)
nouveau lien : http://cjoint.com/?BDEdomnw6vf
Bonne continuation
axion
Salut à vous tous.
Finalement je me sens assez stupide, car il y a une solution directe : Les données de la première série étant en B2:BA2, saisir en BB2 la formule (longue mais simple)
=CONCATENER(B2;C2;D2;E2;F2;G2;H2;I2;J2;K2;L2;M2;N2;O2;P2;Q2;R2;S2; T2;U2;V2;W2;X2;Y2;Z2;AA2;AB2;AC2;AD2;AE2;AF2;AG2;AH2;AI2;AJ2;AK2; AL2;AM2;AN2;AO2;AP2;AQ2;AR2;AS2;AT2;AU2;AV2;AW2;AX2;AY2;AZ2;BA2)
et en BC2 la formule =SI(NB.SI($BB$2:$BB$11;BB2)>1;"Doublon";"unique")
puis les recopier vers le bas.
Tout bêtement !
https://www.cjoint.com/?BDEebBZBEWr
Finalement je me sens assez stupide, car il y a une solution directe : Les données de la première série étant en B2:BA2, saisir en BB2 la formule (longue mais simple)
=CONCATENER(B2;C2;D2;E2;F2;G2;H2;I2;J2;K2;L2;M2;N2;O2;P2;Q2;R2;S2; T2;U2;V2;W2;X2;Y2;Z2;AA2;AB2;AC2;AD2;AE2;AF2;AG2;AH2;AI2;AJ2;AK2; AL2;AM2;AN2;AO2;AP2;AQ2;AR2;AS2;AT2;AU2;AV2;AW2;AX2;AY2;AZ2;BA2)
et en BC2 la formule =SI(NB.SI($BB$2:$BB$11;BB2)>1;"Doublon";"unique")
puis les recopier vers le bas.
Tout bêtement !
https://www.cjoint.com/?BDEebBZBEWr
Bonjour le fil
ma version d'excel 2010, compatible 97-2003 ne prend en compte que les 15 premiers chiffres
dans la fonction NB.SI
d'où une disparité des résultats si un 16eme chiffre d'une liste (col P et suivantes) venait à être différent
un lien : http://cjoint.com/?BDEldgPhX1u
Une solution ?
Cordialement
axion
ma version d'excel 2010, compatible 97-2003 ne prend en compte que les 15 premiers chiffres
dans la fonction NB.SI
d'où une disparité des résultats si un 16eme chiffre d'une liste (col P et suivantes) venait à être différent
un lien : http://cjoint.com/?BDEldgPhX1u
Une solution ?
Cordialement
axion
Bonjour, Patrice
je viens de finaliser une proposition ci jointe :
http://cjoint.com/?BDEpoHgdMF9
avec la fonction NB.SI en complément de SOUS.TOTAL par sécurité obligatoire.
toutefois, dans la proposition CONCATENER et NB.SI, les modifs intervenant en col P, Q... ou X
ne sont pas prises en compte (sauf si un nombre dépassant 9 y est saisi)
puisque NB.SI calcule sur la colonne concaténée
Je ne sais pas si tu obtiens le même souci sur ton programme, mais ici, il persiste.
Merci de ton avis
Cordialement
axion
je viens de finaliser une proposition ci jointe :
http://cjoint.com/?BDEpoHgdMF9
avec la fonction NB.SI en complément de SOUS.TOTAL par sécurité obligatoire.
toutefois, dans la proposition CONCATENER et NB.SI, les modifs intervenant en col P, Q... ou X
ne sont pas prises en compte (sauf si un nombre dépassant 9 y est saisi)
puisque NB.SI calcule sur la colonne concaténée
Je ne sais pas si tu obtiens le même souci sur ton programme, mais ici, il persiste.
Merci de ton avis
Cordialement
axion
Effectivement, lorsque la chaine de caractères ne comprend que des chiffres, seuls les 15 premiers sont pris en compte. Cependant, la méthode du concaténer associée au NB.SI reste la meilleure, il suffit d'ajouter à la série concaténée un caractère non numérique (par exemple @) au début ou à la fin.
Avec la moyenne (sous.total), c'est moins rigoureux, par exemple si tu inverse le premier et le dernier chiffre d'une série tu obtiens la même moyenne
Cordialement
Patrice
Avec la moyenne (sous.total), c'est moins rigoureux, par exemple si tu inverse le premier et le dernier chiffre d'une série tu obtiens la même moyenne
Cordialement
Patrice