Help : statisticiens calcul échantillon

Fermé
sarah - 28 févr. 2012 à 14:47
 sarah - 1 mars 2012 à 12:49
Bonjour,


J'ai bien conscience que ma question n'est pas placée dans le "bon forum" mais ayant conscience que beaucoup de personnes fortes en mathématiques et statistiques y sont présentes je tente ma chance :-)

Voila mon problème : je dois réaliser une étude d'impact pour un établissement (effets engendrés par cet établissement depuis sa création sur ses usagers). Je vais procéder par entretien semi directif puis par questionnaires et pour cela il faut que je calcul un échantillon "n".

Le nombre d'usagers annuels de cet établissement est d'environ 1500 personnes...

J'ai vu sur internet qu'il fallait choisir une marge d'erreur "d" et un seuil de signification "t"...

Pour moi c'est du charabia :-(

Que veulent dire concrètement ces variables et comment calcule t-on "n" ?

Aidez moi SVP






2 réponses

Bruce Willix Messages postés 11968 Date d'inscription mardi 24 mai 2011 Statut Contributeur Dernière intervention 12 juin 2018 2 588
28 févr. 2012 à 15:10
L'objectif c'est d'estimer la taille de l'échantillon que tu dois sélectionner pour pourvoir le considérer représentatif.

Si tu n'es pas calé en stat, sois idiot et utilises "bêtement" la formule (les explications sous-jacentes sur super longues)

Moi j'utilise la formule classique: n=t²p(1-p)/e²

Ou t est le niveau de confiance lié à un intervalle de confiance de 95%, soit1.96 (le caclul est basé sur la loi Normale centrée réduite). Ceci signifie que tu considère que n (ton échantillon) représente N (ta population) à 95%

Pour e, on utilise généralement 0.05 comme valeur. Ca veut dire que tu considères que n représente N à 95% et qu'il y à 5% de chances que ce ne soit pas vrai.

Le vrai problème, c'est d'estimer "p" qui est la probabilité que ton établissement ait effectivement créé un impact sur une personne quelconque de ta population.

Pour bien estimer "p" tu dois bien décrire ta situation: quel établissement ? quel impact ? sur qui ?

Exemples de formulation possibles:
- impact de l'établissement d'un commissariat dans un quartier sur la délinquance.
- impact de l'établissement d'un médecin sur le taux de grippes d'un village
- impact de l'établissement d'un médecin sur le taux de maladies d'un village

Comme tu le vois, la façon de poser la question à de l'importance. Dans les deux derniers cas ici, p sera très différent si on parle de grippes ou de n'importe quelle maladie...

1
"P" doit être un taux ... ?

Je ne vois pas du tout comment le calculer ...

L'établissement en question est un établissement médico-social à but non lucratif, qui dispense de l'information, formation sur une "pathologie", il sensibilise, conseil, fait des diagnostic de personnes susceptibles de présenter cette "pathologie"... et tout est gratuit... ses usagers sont très hétérogènes (famille, enfant, étudiant, professionnels... de tout âge, ils peuvent venir d'une région entière) ... du coup je ne sais pas par ou commencer et comment procéder ?

Merci pour ton aide
0
"e" correspond à quoi ?

Je vais essayer d'aller sur "super longues" comme tu me le conseilles
0
Nyctaclope Messages postés 5315 Date d'inscription dimanche 6 avril 2008 Statut Membre Dernière intervention 11 décembre 2022 1 253
Modifié par Nyctaclope le 28/02/2012 à 19:59
Bonjour à tous deux ..
Sarah :

"p" est une probabilité ( que quelque chose arrive ou soit vrai ), et correspond à la notion habituelle de "nombre de chances sur 100 ", mais elle s'exprime en fraction de l'unité, donc comprise entre 0 et 1. Par exemple 0,6 veut dire soixante pour cent de chances.

Comme te le dit Bruce, la difficulté est d'avoir une "idée" préalable de sa valeur pour calculer la taille de l'échantillon nécessaire. Mais je te propose une astuce :
Dans la formule donnée par Bruce , le produit p(1-p) est maximum quand p vaut 0,5 ( crois moi ). Donc prends p=0,5 et tu vas trouver une taille d'échantillon supérieure à ce qui est théoriquement nécessaire. C'est donc une sécurité. Espérons qu'il ne donne pas un nombre très supérieur au nombre de gens que tu peux sonder ! ...

Commence par faire quelques dizaines de sondages ( c'est bien sûr très insuffisant ) et tu commencera à avoir des "lueurs" sur la valeur à estimer pour "p". Et tu pourras en fonction de cela retoucher la taille de l'échantillon à tester ..

"e" représente l'erreur ( en "chances" ) que tu admets sur le résultat de ton test.
En prenant 0,05 , tu admets qu'il a ( seulement ) 5 chances sur 100 de donner un résultat faux. Tout dépend évidemment du risque pris en cas d'erreur.
S'agissant de sauver un patient, 5% de risque d'échec peut être considéré comme limite. Dans ton cas, un test inexact sur l'influence de ton établissement serait loin d'être dramatique ..

Et prends donc pour "t" et "e" les valeurs que te propose Bruce, sans chercher plus loin. Elles sont habituellement prises pour avoir un résultat suffisamment "sérieux".

A+
Nyctaclope

Le plus joli des poèmes de la mathématique : e^(i.PI)=i^2
trois nombres "sacrés" d'horizons différents qui se donnent la main ...
1
Nyctaclope Messages postés 5315 Date d'inscription dimanche 6 avril 2008 Statut Membre Dernière intervention 11 décembre 2022 1 253
28 févr. 2012 à 21:46
Re
un petit coup de main :
avec t=1,96 p=0,5 e=0,05 tu vas trouver n=384 ..
C'est donc le nombre maxi de personnes que tu auras à sonder ..
Si tu peux faire une estimation provisoire de p, tu pourras réduire cette taille d'échantillon.
A+
Nyctaclope
0
Bruce Willix Messages postés 11968 Date d'inscription mardi 24 mai 2011 Statut Contributeur Dernière intervention 12 juin 2018 2 588
29 févr. 2012 à 09:22
Joli, bien vu !
0
Tout d'abord merci pour ton aide...

Petite précision : p=0.5 signifie qu'il y a 50 % de chances pour que mon établissement est touché au moins une personne de la région, c'est bien ça ?

Je me demande si ça ne serait pas mieux de calculer réellement p car 384 ça fait vraiment bcp

Et quand tu dis que j'aurai 384 personnes à sonder au maxi cela veut dire que ça peut être moins ?
0
Bruce Willix Messages postés 11968 Date d'inscription mardi 24 mai 2011 Statut Contributeur Dernière intervention 12 juin 2018 2 588
29 févr. 2012 à 09:38
C'est exactement ce que Nyctalope t'explique.

Avec p=0.5, tu choisis en fait le pire des cas (une chance sur deux que ton établissement n'ait aucun impact) et donc ton résultat te donne le "plus gros" échantillon que tu devrais choisir.

Si tu parviens à avoir une meilleure estimation (via des études similaires par exemple), tu trouveras probablement une valeur de p différente, mieux estimée et qui te permettra de réduire la taille de ton échantillon.
0
ok ...

Qu'est-ce que vous entendez par "études similaires" ? (Je suis vraiment novice et du coup ça ne me parle pas ! )

Merci
0