Fréquence d'une valeur (un mot) non défini a priori

Fermé
Phill123456 Messages postés 2 Date d'inscription lundi 2 février 2015 Statut Membre Dernière intervention 2 février 2015 - 2 févr. 2015 à 15:15
JvDo Messages postés 1978 Date d'inscription mercredi 27 juillet 2005 Statut Membre Dernière intervention 28 septembre 2020 - 3 févr. 2015 à 07:30
Bonjour à toutes et à tous,

J'ai 4000 cellules avec des dénominations d'entreprises composées de 1, 2 voire 3 mots.
Je souhaite connaître les termes qui ressortent le plus souvent
Une formule pour scanner cette plage ? A la limite un peu de VBA si pas possible autrement.

Merci beaucoup pour votre aide : )
A voir également:

3 réponses

ccm81 Messages postés 10904 Date d'inscription lundi 18 octobre 2010 Statut Membre Dernière intervention 24 décembre 2024 2 428
2 févr. 2015 à 16:18
Bonjour

Un essai
https://www.cjoint.com/?3BcqCciNZMz

Cdlmnt
0
Gyrus Messages postés 3334 Date d'inscription samedi 20 juillet 2013 Statut Membre Dernière intervention 9 décembre 2016 524
2 févr. 2015 à 16:52
Bonjour Phill123456
Bonjour ccm81,

Voici une macro qui scinde les textes en interprétant les caractères apostrophe, tiret et espace comme des séparateurs et qui fait le compte des mots obtenus.
La liste et le compte des mots étant établis, il te restera à faire un tri décroissant pour obtenir le résultat attendu.
Si j'ai bien suivi, la macro de ccm1 fait sensiblement la même chose mais ne prend en compte que le séparateur espace. Par contre le tri est en prime.

https://www.cjoint.com/c/EBcrb2ghNlk

A+
0
ccm81 Messages postés 10904 Date d'inscription lundi 18 octobre 2010 Statut Membre Dernière intervention 24 décembre 2024 2 428
2 févr. 2015 à 20:25
Bonsoir Gyrus

Bonne idée de prendre en compte plusieurs séparateurs
Du coup, j'ai amélioré l'exemple
https://www.cjoint.com/?3BcuIBMGZiM

Cdlmnt
0
Phill123456 Messages postés 2 Date d'inscription lundi 2 février 2015 Statut Membre Dernière intervention 2 février 2015
2 févr. 2015 à 23:37
Merci bcp pour vos réponses c'est parfait. Dans la continuité de ma première question, je cherche des façons pertinentes et originales de "faire parler" ces 4000 noms d'entreprises. J'ai donc les termes qui ressortent le plus souvent, le nombre moyen de mots, de lettres, la même chose avec des quartiles etc. D'autres idées de statistiques sur une série de noms d'entreprises ?
Merci encore vous avez gérés !
0
JvDo Messages postés 1978 Date d'inscription mercredi 27 juillet 2005 Statut Membre Dernière intervention 28 septembre 2020 858
3 févr. 2015 à 07:30
Bonjour à tous,

pour avoir des idées de stat, il faudrait connaître les variables dont tu disposes.
généralement, quand on cherche à comprendre ses données, on commence par une ACP. Je ne sais pas si ça s'applique à ce que tu veux faire.

Sinon, tu peux ajouter une distance entre mots à tes données. Je ne sais pas ce que ça pourrait t'apporter mais comme c'est gratuit, pourquoi s'en priver.

Function levenshtein(a As String, b As String) As Integer
Dim i As Integer, j As Integer, cost As Integer, d() As Integer, min1 As Integer, min2 As Integer, min3 As Integer
If Len(a) = 0 Then: levenshtein = Len(b): Exit Function
If Len(b) = 0 Then: levenshtein = Len(a): Exit Function
ReDim d(Len(a), Len(b))
For i = 0 To Len(a): d(i, 0) = i: Next
For j = 0 To Len(b): d(0, j) = j: Next
For i = 1 To Len(a)
For j = 1 To Len(b)
d(i, j) = Application.WorksheetFunction.Min((d(i - 1, j) + 1), (d(i, j - 1) + 1), (d(i - 1, j - 1) + 1 + (Mid(a, i, 1) = Mid(b, j, 1))))
Next
Next
levenshtein = d(Len(a), Len(b))
End Function

ce code à peine modifié vient de wikipedia.

cordialement
0