Kurtosis

Dans la théorie des probabilités et les statistiques , le kurtosis (du κυρτός de mot, des kyrtos de ou des kurtos grecs de , signifiant l'enflement) est une mesure du " ; peakedness" ; de la distribution de probabilité d'un vrai - variable aléatoire évaluée . Un kurtosis plus élevé signifie que plus du désaccord est dû aux déviations extrêmes peu fréquentes, par opposition aux déviations modeste-classées fréquentes.

Définition de kurtosis

Le moment normalisé le quatrième par est défini en tant que, de \ frac de {\ mu_4} {\ sigma^4} \ ! là où &mu ; 4 est le quatrième moment de au sujet du et du &sigma moyens ; est l'écart type . Ceci est parfois employé comme définition de kurtosis dans des travaux plus anciens, mais n'est pas la définition utilisée ici.

Le kurtosis est généralement défini comme quatrième cumulant divisé par la place du désaccord de la distribution de probabilité, de

\ gamma_2 = \ = de frac {\ kappa_4} {\ kappa_2^2} \ frac {\ mu_4} {\ sigma^4} - 3, \ !

ce qui est connu comme kurtosis excessif . Le " ; 3" moindre ; à la fin de cette formule est souvent expliqué comme correction pour faire le kurtosis de l'égale de distribution normale à zéro. Une autre raison peut être vue en regardant la formule pour le kurtosis de la somme de variables aléatoires. En raison de l'utilisation du cumulant, si le Y est la somme de variables aléatoires indépendantes du du n , toutes avec la même distribution que le X , puis Kurt  ; =  ; Kurt  ; /  ; n , alors que la formule serait plus compliquée si le kurtosis étaient définis comme &mu ; 4  ; /  ; &sigma ; 4.

Plus généralement, si le X 1,…, le n de du X sont des variables aléatoires indépendantes toutes qui ont le le même désaccord , puis

\ operatorname {} de Kurt \ laissé (\ ^n X_i de sum_ {i=1} \ droit) = {1 \ au-dessus de n^2} \ ^n du sum_ {i=1} \ operatorname {Kurt} (X_i),

considérant que cette identité ne tiendrait pas si la définition n'incluait pas la soustraction de 3. < ! -- Le kurtosis peut s'étendre du &minus ; 2 à +infinity. -->

Le quatrième moment normalisé doit être au moins 1, ainsi le kurtosis excessif doit être &minus ; 2 ou plus ; il n'y a aucune limite supérieure et elle peut être infinie.

Terminologie et exemples

Une distribution élevée de kurtosis a un " plus pointu ; peak" ; et un " plus plat ; tails" ; , alors qu'une basse distribution de kurtosis a une crête plus arrondie avec un " plus large ; shoulders" ;.

Des distributions avec le kurtosis nul s'appellent le , ou mesokurtotic mésocurtique. L'exemple le plus en avant d'une distribution mésocurtique est la famille de distribution normale du , indépendamment des valeurs de ses paramètres que quelques autres distributions bien connues peuvent être mésocurtiques, selon des valeurs de paramètre : par exemple la distribution binomiale est mésocurtique pour le p = 1/2 \ P. \ racine carrée {1/12} .

Une distribution avec le kurtosis positif du s'appelle le , ou leptokurtotic leptocurtique. En termes de forme, une distribution leptocurtique a un " plus aigu ; peak" ; autour du moyen (c'est-à-dire, une probabilité plus élevée de qu'une variable normalement distribuée des valeurs près du moyen) et du " ; La graisse de coupe la queue le quot de ; (c'est-à-dire, une probabilité plus élevée qu'une variable normalement distribuée de valeurs extrêmes . Les exemples des distributions leptocurtiques incluent la distribution de Laplace et la distribution logistique . De telles distributions se nomment parfois " ; Gaussian" superbe ;.

Une distribution avec le kurtosis négatif s'appelle le , ou platykurtotic platykurtic. En termes de forme, une distribution platykurtic a un plus petit " ; peak" ; autour du moyen (c'est-à-dire, une probabilité inférieure qu'une variable normalement distribuée des valeurs près du moyen) et du " ; tails" mince ; (c'est-à-dire, une probabilité inférieure qu'une variable normalement distribuée de valeurs extrêmes . Les exemples des distributions platykurtic incluent les distributions uniformes continu ou discret et la distribution de cosinus augmentée par . De toute la distribution platykurtic est la distribution de Bernoulli avec le p = ½ (par exemple le nombre de fois une obtient le " ; heads" ; en renversant une pièce de monnaie une fois), pour laquelle le kurtosis est -2. De telles distributions se nomment parfois " ; Gaussian" secondaire ;.

Exemples graphiques

Le type famille de Pearson de VII

Nous illustrons les effets du kurtosis using une famille paramétrique des distributions dont le kurtosis peut être ajusté tandis que leurs moments et cumulants de bas-ordre demeurent constants. Considérer le type le famille de Pearson de de VII, qui est une caisse spéciale du type le famille de Pearson de d'IV limitée aux densités symétriques. La fonction de densité de probabilité est donnée près f de

(x ; a, m) = \ frac {\ gamma (m)} {a \, \ racine carré} {\ pi \, \ gamma (m-1/2)} \ est parti \, de right^ {- m} \ !

là où le un est un paramètre de balance de et le m est un paramètre de forme de .

Toutes les densités dans ce famille sont symétriques. Le moment de Th du k existe le m> fourni (k+1)/2. Pour que le kurtosis existe, nous avons besoin de m>5/2. Puis le moyen et l'obliquité existent et sont tous deux mettent à zéro identiquement. Plaçant a^2 = 2m-3 rend le désaccord égal à l'unité. Alors le seul paramètre libre est le m , qui commande le quatrième moment (et le cumulant) et par conséquent le kurtosis. On peut reparameterize avec le m = 5/2 + 3 \ gamma_2, où le \ gamma_2 est le kurtosis comme défini ci-dessus. Ceci rapporte à un un-paramètre le famille leptocurtique avec zéro moyens, désaccord d'unité, obliquité nulle, et kurtosis positif arbitraire. La densité reparameterized est g de

(x ; \ gamma_2) = f (x ; \ ; , de l'a= \ racine carrée {2+6/\ gamma_2} \ ; m=5/2+3/\ gamma_2). \ !

En limite comme \ gamma_2 \ à \ infty on obtient la densité g de

(x) = 3 \ ont laissé (2 + x^2 \ droit), de ^ {- 5/2} \ !

ce qui est montré comme courbe rouge dans les images du côté droit.

En l'autre direction comme \ gamma_2 \ à 0 on obtient la densité standard de la normale comme distribution de limitation, montrée comme courbe noire.

Dans les images du côté droit, la courbe bleue représente le x de densité \ mapsto g (x ; 2) avec le kurtosis de 2. L'image supérieure prouve que les densités leptocurtiques dans ce famille ont une crête plus élevée que la densité normale mésocurtique. Les queues comparativement plus grosses des densités leptocurtiques sont illustrées dans la deuxième image, qui trace le logarithme naturel du type densités de Pearson de VII : la courbe noire est le logarithme de la densité normale standard, qui est une parabole inversée . On peut voir que la densité normale assigne peu de masse de probabilité aux régions loin du moyen (" ; a le tails" mince ;), comparé à la courbe bleue du type leptocurtique de Pearson densité de VII avec le kurtosis de 2. Entre la courbe bleue et le noir sont l'autre type de Pearson densités de VII avec le &gamma ; 2  ; =  ; 1, 1/2, 1/4, 1/8, et 1/16. La courbe rouge montre encore la limite supérieure du type de Pearson famille de VII, avec le \ gamma_2 = \ infty (ce qui, à proprement parler, signifie que le quatrième moment n'existe pas). La courbe rouge diminue le plus lent en tant qu'une monte de l'origine (" ; a le gros tails" ;).

Kurtosis des distributions bien connues

Dans cet exemple nous comparons plusieurs distributions bien connues de différentes familles paramétriques. Toutes les densités considérées ici sont unimodales et symétriques. Chacun a un moyen et une obliquité de zéro. Des paramètres ont été choisis pour avoir comme conséquence un désaccord de l'unité dans chaque cas. Les images sur la bonne exposition courbe pour les sept densités suivantes, sur une échelle linéaire et l'échelle logarithmique :

D : Distribution de Laplace , a. double distribution exponentielle, courbe rouge (deux lignes droites dans notation-mesurent la parcelle de terrain), kurtosis = 3

S : Distribution sécante hyperbolique , courbe orange, kurtosis de = 2

L : Distribution logistique , courbe verte, kurtosis de = 1.2

N : de distribution normale, courbe noire (la parabole inversée dans notation-mesurent la parcelle de terrain), kurtosis = 0
C : Distribution , courbe cyan, kurtosis = −0.593762 de cosinus augmentée par …

W : Distribution , courbe bleue, kurtosis = −1 de demi-cercle de Wigner de

U : distribution uniforme , courbe magenta (montrée pour la clarté comme rectangle dans les deux images), kurtosis = −1.

Noter que dans ce cas-ci les densités platykurtic ont lié l'appui, tandis que les densités avec le kurtosis non négatif sont soutenues sur la vraie ligne entier.

Là existent en général des densités platykurtic avec l'appui infini, par exemple les distributions d'énergie exponentielles avec le suffisamment grand b de paramètre de forme, et existent là des densités leptocurtiques avec l'appui fini, par exemple une distribution qui est uniforme entre -3 et -0.3 et 3, avec la même densité dans (- 3, -0.3, 3) des intervalles, mais avec 20 fois plus de densité dans (- 0.

Kurtosis d'échantillon

Pour un échantillon du n évalue le kurtosis d'échantillon de est de

g_2 = \ = -3 \ frac du frac {m_4} {m_ {2} ^2} {n \, \ sum_ {i=1} ^n (x_i - \ overline {x}) ^4} {\ laissé (\ - ^n de sum_ {i=1} (x_i \ overline {x}) ^2 \) ^2 droit} - 3

là où le m 4 est le quatrième moment de témoin au sujet du moyen, le m 2 est le deuxième moment d'échantillon au sujet du moyen (c'est-à-dire, le désaccord d'échantillon ), le i de du X est la valeur du i th, et le \ overline {x} est le moyen d'échantillon .

Le de de formule D = {1 \ au-dessus de n} \ ^n du sum_ {i=1} {(x_i - \ barre {x}) ^2} , de
E = {1 \ au-dessus de n D^2} \ ^n de sum_ {i=1} {(- de x_i \ barre {x}) ^4} - 3 est également employé, où n - la dimension de l'échantillon, le D - le désaccord pré-calculé, xi - la valeur de la mesure et du \ de barre de x'th {x} - la moyenne arithmétique pré-calculée.

Estimateurs de kurtosis de population

Donné un sous-ensemble d'échantillons provenant d'une population, le kurtosis d'échantillon ci-dessus est un estimateur décentré du kurtosis de population. L'estimateur habituel du kurtosis de population (employé dans SAS , Minitab , SPSS , et Excel mais pas par BMDP ) est le G 2, défini comme suit :

Voir également


obliquité
Risque d'obliquité de
Risque de kurtosis de

.

Random links:Banlieue noire de Webster, Minnesota | La bosse du célibataire | Matteo Maria Boiardo |

de Buffalo d'USS (SSN-715) | IFO | Curtosis