Taille d\'effet

Dans les statistiques , la taille d'effet de est une mesure de la force du rapport entre deux variables. Dans des expériences scientifiques, il est souvent utile de savoir non seulement si une expérience a un effet significatif du statistiquement , mais également la taille tous les effets observés. Dans des situations pratiques, les tailles d'effet sont utiles pour prendre des décisions. Les mesures de taille d'effet sont la devise commune des études de la méta-analyse qui récapitulent les résultats d'un domaine de recherche spécifique.

Résumé

Le concept de la taille d'effet apparaît dans la langue journalière. Par exemple, un programme de perte de poids peut revendiquer qu'il mène à une perte de poids moyenne de 30 livres. Dans ce cas-ci, 30 livres est un indicateur de la taille réclamée d'effet. Un autre exemple est qu'un programme de cours particuliers peut réclamer qu'il élève l'exécution d'école d'une catégorie de lettre. Cette augmentation de catégorie est la taille réclamée d'effet du programme.

Une taille d'effet mieux est expliquée par un exemple : si vous n'aviez aucun contact précédent avec des humains, et un jour visitait le Angleterre , combien de personnes devriez-vous voir avant que vous vous rendez-vous compte que, en moyenne, les hommes sont plus grands que des femmes là ? La réponse se rapporte à la taille d'effet de la différence dans la taille moyenne entre les hommes et les femmes. Plus la taille d'effet est grande, plus il est facile de voir que les hommes sont plus grands. Si la différence de taille étaient petite, alors elle exigerait savoir les tailles de beaucoup d'hommes et de femmes pour noter que (en moyenne les hommes sont plus grands que des femmes. Cet exemple est démontré plus loin ci-dessous.

Dans les statistiques déductives , une taille d'effet aide à déterminer si une différence significative du statistiquement est une différence de souci pratique. En d'autres termes, donné une dimension de l'échantillon suffisamment grande, il est toujours possible de prouver qu'il y a une différence entre deux moyens étant comparés dehors à une certaine position décimale. La taille d'effets nous aide à savoir si la différence observée est une différence qui importe. Effectuer la taille, avec la dimension de l'échantillon et le critique de niveau de signification \ alpha, et la puissance dans l'essai d'hypothèse statistique de sont connexe, et des n'importe quelles de ces valeurs peuvent être déterminées données les autres. Dans la méta-analyse , des tailles d'effet sont employées comme action commune qui peut être calculée pour différentes études et être puis combinée dans des analyses globales.

La taille d'effet de limite est la plus utilisée généralement aux mesures normalisées décrites d'effet (par exemple, r , d de Cohen, rapport de chance, etc. Cependant, les mesures unstandardized (par exemple, la différence crue entre les moyens de groupe, les coefficients de régression unstandardized, etc.) peuvent également être des mesures de taille d'effet. Des mesures normalisées de taille d'effet sont typiquement employées quand la métrique des variables étant étudiées n'a pas la signification intrinsèque au lecteur (par exemple, des points sur un test de personnalité sur une échelle arbitraire), ou quand des résultats des études multiples sont combinés quand certains ou toutes les études emploient différentes balances. Quelques étudiants ont confondu la recommandation de Wilkinson et le groupe de travail d'APA sur l'inférence statistique (1999, P. 599)-- Tailles toujours actuelles d'effet de pour les résultats primaires --en tant que ce reportage normalisé mesure de l'effet comme le d de Cohen est la condition de défaut. En fait, juste suivant la phrase les auteurs a ajouté cela -- Le si les unités de la mesure sont signicatives à un niveau pratique (par exemple, nombre de cigarettes fumées par jour), puis nous préfèrent habituellement une mesure unstandardized (coefficient de régression ou différence moyenne) à une mesure normalisée (r ou d) .

Types

Corrélation du r de Pearson

La corrélation du r de Pearson est l'une des tailles d'effet les plus employées couramment. Elle peut être employée quand les données sont continues ou binaires, ainsi le r de Pearson est discutablement la taille d'effet la plus souple. C'était la première taille importante d'effet à développer dans les statistiques, et il a été présenté par le Karl Pearson . Le r de Pearson peut varier dans la grandeur de -1 à 1, avec -1 indiquant un rapport négatif parfait, 1 indiquant un rapport positif parfait, et 0 n'indiquant aucun rapport entre deux variables. Cohen (1988, 1992) donne les principes de base : petit = 0.

Une autre mesure employée souvent de la taille du rapport entre deux variables est à angle droit du r , souvent désigné sous le nom du " ; r - squared" ; ou le coefficient de de de détermination . C'est une mesure de la proportion du désaccord partagée par les deux variables et varie de 0 à 1.21 suggérerait que 21% du désaccord soit partagé par ces deux variables.

Le d de Cohen

Le d de Cohen est la mesure appropriée de taille d'effet d'employer dans le cadre d'un T-essai sur des moyens. le d est défini comme la différence entre deux moyens s'est divisée par l'écart type mis en commun par pour ces moyens. Ainsi, dans le cas où les deux échantillons sont les mêmes tailles, d de

= {\ - moyen} \ mathrm _2 {moyen} de mathrm _1 {\ au-dessus de \ racine carrée {(\ + de mathrm {écart-type} _1^2 \ mathrm {écart-type} _2^2) /2 \}}

où le i de mean et le i de SD sont le moyen et l'écart type pour le de groupe i , pour le i = 1, 2.

Les personnes différentes offrent le conseil différent concernant la façon interpréter la taille résultante d'effet, mais l'opinion la plus admise est celle de Cohen (1992) où 0.2 est indicatif d'un léger effet, 0.8 une taille de grand effet.

Ainsi, dans l'exemple ci-dessus de visiter l'Angleterre et d'observer la taille d'hommes et de femmes, les données (Aaron, Kromrey, et Ferron, 1998, novembre ; d'un groupe représentatif des 2004 R-U de 2436 hommes et de 3311 femmes) est :
hommes de

: Taille moyenne = 1750 millimètres ; Écart type = 89.93 millimètres
Femmes : Taille moyenne = 1612 millimètres ; Écart type = 69.05 millimètres

La taille d'effet (using le d de Cohen) égalerait 1.72 (intervalles de confiance de de 95% 1. C'est très grand et vous ne devriez avoir aucun problème en détectant qu'il y a une différence cohérente de taille, en moyenne, entre les hommes et les femmes.

Un point à noter, bien que, est que dans certains cas il peut être sage d'employer juste un des écarts type (par exemple, écart type de traitement préparatoire dans une épreuve thérapeutique). L'une ou l'autre manière, notent que la dimension de l'échantillon ne joue pas un rôle dans le calcul - points remarquables par Hedges.

Ĝ du des haies

Hedges et Olkin (1985) ont noté qu'on pourrait ajuster des évaluations de taille d'effet en tenant compte de la dimension de l'échantillon. Le problème avec le d de Cohen est que les résultats sont fortement influencés par le dénominateur dans l'équation. Si un écart type est plus grand que l'autre alors le dénominateur est pesé dans cette direction et la taille d'effet est plus conservatrice. Cependant, sûrement elle semble plus de raisonnable de mettre des actions dans la dimension de l'échantillon plus grande ? Le ĝ du des haies incorpore la dimension de l'échantillon par tous les deux qui calculent un dénominateur que les regards aux dimensions de l'échantillon des écarts type respectifs et fait également à un ajustement à la taille globale d'effet basée sur cette dimension de l'échantillon. La formule pour le ĝ du des haies (comme employé par le logiciel tel que le générateur de taille d'effet) est :

\ chapeau {g} = \ frac {\ barre {x} _1 - \ barre {x} _2} {\ racine carrée {\ frac {(n_1 - 1) SD_1^2 + (n_2 - 1) SD_2^2} {(N_ \ mathrm {total} - 2)}}} \ périodes \ orge à quatre rangs (1 \ frac {3} {4 (n_1+n_2) - 9} \ orge à quatre rangs).

Dans l'exemple ci-dessus de « taille », la taille d'effet du ĝ du des haies égale 1.76 (intervalles de confiance de de 95% 1. Notification comment la grande dimension de l'échantillon a augmenté la taille d'effet du d de Cohen ? Si, au lieu de cela, les données disponibles étaient de seulement 90 hommes et le ĝ du de 80 haies de femmes fournirait une évaluation plus conservatrice de taille d'effet : 1.70 (avec de plus grands intervalles de confiance de de 95% 1.

Le f^ de Cohen {2}

Le f^ de Cohen {2} est la mesure appropriée de taille d'effet d'employer dans le cadre d'un test F pour la corrélation multiple ou la régression multiple . La mesure de taille d'effet du f^ {2} pour la régression multiple est définie comme : f^ de

{2} = {R^ {2} \ plus de 1 - R^ {2}}

où le R^ {2} est la corrélation multiple carrée par .

La mesure de taille d'effet du f^ {2} pour la régression multiple hiérarchique est définie comme :

f^ {2} = {(_ de R^ {2} {ab} - 2}) de _A de R^ {\ plus de 1 - _ de R^ {2} {ab}} le

où le R^ {2} _A est le désaccord expliqué par un ensemble de A d'une ou plusieurs variables indépendantes, et le _ du R^ {2} {ab} est le désaccord combiné expliqué par un A et un ensemble différent de B d'une ou plusieurs variables indépendantes.

Par convention, des tailles d'effet du f^ {2} de 0.35 sont considérées petites, moyennes, et grandes, respectivement (Cohen, 1988).

φ, φ de Cramer, ou V de Cramer

Rapport de chance

Le rapport de chance de est une autre taille utile d'effet. Il est approprié quand les deux variables sont binaires. Par exemple, considérer une étude sur l'épellation. Dans un groupe de commande, deux étudiants passent la classe pour chacun qui échoue, ainsi la chance du dépassement est de deux à un (ou plus brièvement 2/1 = 2). Dans le groupe de traitement, six étudiants passent pour chacun qui échoue, ainsi la chance du dépassement est de six à un (ou 6/1 = 6). La taille d'effet peut être calculée en notant que la chance du dépassement dans le groupe de traitement est trois fois plus haut que dans le groupe de commande (parce que 6 divisés par 2 est 3). Par conséquent, le rapport de chance est 3. Cependant, les statistiques de rapport de chance sont sur une échelle différente au D. Ainsi, ces « 3 » n'est pas comparable au d d'un Cohen de « 3 ».

Voir également

Counternull
Points standard
Rapport de chance de

.

Random links:Amaryllis | Ready-to-wear | Qui a déplacé mon fromage ? | L'Abbaye | Château de Bognie | Tamaño_del_efecto