2 réponses
Bruce Willix
Messages postés
11968
Date d'inscription
mardi 24 mai 2011
Statut
Contributeur
Dernière intervention
12 juin 2018
2 588
28 févr. 2012 à 15:10
28 févr. 2012 à 15:10
L'objectif c'est d'estimer la taille de l'échantillon que tu dois sélectionner pour pourvoir le considérer représentatif.
Si tu n'es pas calé en stat, sois idiot et utilises "bêtement" la formule (les explications sous-jacentes sur super longues)
Moi j'utilise la formule classique: n=t²p(1-p)/e²
Ou t est le niveau de confiance lié à un intervalle de confiance de 95%, soit1.96 (le caclul est basé sur la loi Normale centrée réduite). Ceci signifie que tu considère que n (ton échantillon) représente N (ta population) à 95%
Pour e, on utilise généralement 0.05 comme valeur. Ca veut dire que tu considères que n représente N à 95% et qu'il y à 5% de chances que ce ne soit pas vrai.
Le vrai problème, c'est d'estimer "p" qui est la probabilité que ton établissement ait effectivement créé un impact sur une personne quelconque de ta population.
Pour bien estimer "p" tu dois bien décrire ta situation: quel établissement ? quel impact ? sur qui ?
Exemples de formulation possibles:
- impact de l'établissement d'un commissariat dans un quartier sur la délinquance.
- impact de l'établissement d'un médecin sur le taux de grippes d'un village
- impact de l'établissement d'un médecin sur le taux de maladies d'un village
Comme tu le vois, la façon de poser la question à de l'importance. Dans les deux derniers cas ici, p sera très différent si on parle de grippes ou de n'importe quelle maladie...
Si tu n'es pas calé en stat, sois idiot et utilises "bêtement" la formule (les explications sous-jacentes sur super longues)
Moi j'utilise la formule classique: n=t²p(1-p)/e²
Ou t est le niveau de confiance lié à un intervalle de confiance de 95%, soit1.96 (le caclul est basé sur la loi Normale centrée réduite). Ceci signifie que tu considère que n (ton échantillon) représente N (ta population) à 95%
Pour e, on utilise généralement 0.05 comme valeur. Ca veut dire que tu considères que n représente N à 95% et qu'il y à 5% de chances que ce ne soit pas vrai.
Le vrai problème, c'est d'estimer "p" qui est la probabilité que ton établissement ait effectivement créé un impact sur une personne quelconque de ta population.
Pour bien estimer "p" tu dois bien décrire ta situation: quel établissement ? quel impact ? sur qui ?
Exemples de formulation possibles:
- impact de l'établissement d'un commissariat dans un quartier sur la délinquance.
- impact de l'établissement d'un médecin sur le taux de grippes d'un village
- impact de l'établissement d'un médecin sur le taux de maladies d'un village
Comme tu le vois, la façon de poser la question à de l'importance. Dans les deux derniers cas ici, p sera très différent si on parle de grippes ou de n'importe quelle maladie...
Nyctaclope
Messages postés
5315
Date d'inscription
dimanche 6 avril 2008
Statut
Membre
Dernière intervention
11 décembre 2022
1 253
Modifié par Nyctaclope le 28/02/2012 à 19:59
Modifié par Nyctaclope le 28/02/2012 à 19:59
Bonjour à tous deux ..
Sarah :
"p" est une probabilité ( que quelque chose arrive ou soit vrai ), et correspond à la notion habituelle de "nombre de chances sur 100 ", mais elle s'exprime en fraction de l'unité, donc comprise entre 0 et 1. Par exemple 0,6 veut dire soixante pour cent de chances.
Comme te le dit Bruce, la difficulté est d'avoir une "idée" préalable de sa valeur pour calculer la taille de l'échantillon nécessaire. Mais je te propose une astuce :
Dans la formule donnée par Bruce , le produit p(1-p) est maximum quand p vaut 0,5 ( crois moi ). Donc prends p=0,5 et tu vas trouver une taille d'échantillon supérieure à ce qui est théoriquement nécessaire. C'est donc une sécurité. Espérons qu'il ne donne pas un nombre très supérieur au nombre de gens que tu peux sonder ! ...
Commence par faire quelques dizaines de sondages ( c'est bien sûr très insuffisant ) et tu commencera à avoir des "lueurs" sur la valeur à estimer pour "p". Et tu pourras en fonction de cela retoucher la taille de l'échantillon à tester ..
"e" représente l'erreur ( en "chances" ) que tu admets sur le résultat de ton test.
En prenant 0,05 , tu admets qu'il a ( seulement ) 5 chances sur 100 de donner un résultat faux. Tout dépend évidemment du risque pris en cas d'erreur.
S'agissant de sauver un patient, 5% de risque d'échec peut être considéré comme limite. Dans ton cas, un test inexact sur l'influence de ton établissement serait loin d'être dramatique ..
Et prends donc pour "t" et "e" les valeurs que te propose Bruce, sans chercher plus loin. Elles sont habituellement prises pour avoir un résultat suffisamment "sérieux".
A+
Nyctaclope
Le plus joli des poèmes de la mathématique : e^(i.PI)=i^2
trois nombres "sacrés" d'horizons différents qui se donnent la main ...
Sarah :
"p" est une probabilité ( que quelque chose arrive ou soit vrai ), et correspond à la notion habituelle de "nombre de chances sur 100 ", mais elle s'exprime en fraction de l'unité, donc comprise entre 0 et 1. Par exemple 0,6 veut dire soixante pour cent de chances.
Comme te le dit Bruce, la difficulté est d'avoir une "idée" préalable de sa valeur pour calculer la taille de l'échantillon nécessaire. Mais je te propose une astuce :
Dans la formule donnée par Bruce , le produit p(1-p) est maximum quand p vaut 0,5 ( crois moi ). Donc prends p=0,5 et tu vas trouver une taille d'échantillon supérieure à ce qui est théoriquement nécessaire. C'est donc une sécurité. Espérons qu'il ne donne pas un nombre très supérieur au nombre de gens que tu peux sonder ! ...
Commence par faire quelques dizaines de sondages ( c'est bien sûr très insuffisant ) et tu commencera à avoir des "lueurs" sur la valeur à estimer pour "p". Et tu pourras en fonction de cela retoucher la taille de l'échantillon à tester ..
"e" représente l'erreur ( en "chances" ) que tu admets sur le résultat de ton test.
En prenant 0,05 , tu admets qu'il a ( seulement ) 5 chances sur 100 de donner un résultat faux. Tout dépend évidemment du risque pris en cas d'erreur.
S'agissant de sauver un patient, 5% de risque d'échec peut être considéré comme limite. Dans ton cas, un test inexact sur l'influence de ton établissement serait loin d'être dramatique ..
Et prends donc pour "t" et "e" les valeurs que te propose Bruce, sans chercher plus loin. Elles sont habituellement prises pour avoir un résultat suffisamment "sérieux".
A+
Nyctaclope
Le plus joli des poèmes de la mathématique : e^(i.PI)=i^2
trois nombres "sacrés" d'horizons différents qui se donnent la main ...
Nyctaclope
Messages postés
5315
Date d'inscription
dimanche 6 avril 2008
Statut
Membre
Dernière intervention
11 décembre 2022
1 253
28 févr. 2012 à 21:46
28 févr. 2012 à 21:46
Re
un petit coup de main :
avec t=1,96 p=0,5 e=0,05 tu vas trouver n=384 ..
C'est donc le nombre maxi de personnes que tu auras à sonder ..
Si tu peux faire une estimation provisoire de p, tu pourras réduire cette taille d'échantillon.
A+
Nyctaclope
un petit coup de main :
avec t=1,96 p=0,5 e=0,05 tu vas trouver n=384 ..
C'est donc le nombre maxi de personnes que tu auras à sonder ..
Si tu peux faire une estimation provisoire de p, tu pourras réduire cette taille d'échantillon.
A+
Nyctaclope
Bruce Willix
Messages postés
11968
Date d'inscription
mardi 24 mai 2011
Statut
Contributeur
Dernière intervention
12 juin 2018
2 588
29 févr. 2012 à 09:22
29 févr. 2012 à 09:22
Joli, bien vu !
Tout d'abord merci pour ton aide...
Petite précision : p=0.5 signifie qu'il y a 50 % de chances pour que mon établissement est touché au moins une personne de la région, c'est bien ça ?
Je me demande si ça ne serait pas mieux de calculer réellement p car 384 ça fait vraiment bcp
Et quand tu dis que j'aurai 384 personnes à sonder au maxi cela veut dire que ça peut être moins ?
Petite précision : p=0.5 signifie qu'il y a 50 % de chances pour que mon établissement est touché au moins une personne de la région, c'est bien ça ?
Je me demande si ça ne serait pas mieux de calculer réellement p car 384 ça fait vraiment bcp
Et quand tu dis que j'aurai 384 personnes à sonder au maxi cela veut dire que ça peut être moins ?
Bruce Willix
Messages postés
11968
Date d'inscription
mardi 24 mai 2011
Statut
Contributeur
Dernière intervention
12 juin 2018
2 588
29 févr. 2012 à 09:38
29 févr. 2012 à 09:38
C'est exactement ce que Nyctalope t'explique.
Avec p=0.5, tu choisis en fait le pire des cas (une chance sur deux que ton établissement n'ait aucun impact) et donc ton résultat te donne le "plus gros" échantillon que tu devrais choisir.
Si tu parviens à avoir une meilleure estimation (via des études similaires par exemple), tu trouveras probablement une valeur de p différente, mieux estimée et qui te permettra de réduire la taille de ton échantillon.
Avec p=0.5, tu choisis en fait le pire des cas (une chance sur deux que ton établissement n'ait aucun impact) et donc ton résultat te donne le "plus gros" échantillon que tu devrais choisir.
Si tu parviens à avoir une meilleure estimation (via des études similaires par exemple), tu trouveras probablement une valeur de p différente, mieux estimée et qui te permettra de réduire la taille de ton échantillon.
28 févr. 2012 à 16:36
Je ne vois pas du tout comment le calculer ...
L'établissement en question est un établissement médico-social à but non lucratif, qui dispense de l'information, formation sur une "pathologie", il sensibilise, conseil, fait des diagnostic de personnes susceptibles de présenter cette "pathologie"... et tout est gratuit... ses usagers sont très hétérogènes (famille, enfant, étudiant, professionnels... de tout âge, ils peuvent venir d'une région entière) ... du coup je ne sais pas par ou commencer et comment procéder ?
Merci pour ton aide
28 févr. 2012 à 16:42
Je vais essayer d'aller sur "super longues" comme tu me le conseilles