Statistique d\'ordre
Dans les statistiques , la statistique d'ordre de de Th du k d'un échantillon statistique est égale à sa Th-petite valeur du k . En même temps que les statistiques de grade de les statistiques d'ordre sont parmi les outils les plus fondamentaux dans les statistiques non paramétriques et l'inférence .
Les cas spéciaux importants des statistiques d'ordre sont le minimum et valeur maximum du d'un échantillon, et (quelques qualifications étant discuté ci-dessous) l'échantillon médian de et d'autres quantiles d'échantillon de .
En employant la théorie des probabilités pour analyser des statistiques d'ordre des échantillons aléatoires d'une distribution continue , la fonction de répartition cumulative est employée pour ramener l'analyse au cas des statistiques d'ordre de la distribution uniforme .
Notation et exemples
Par exemple, supposer que quatre nombres sont observés ou enregistrés, ayant pour résultat un échantillon de la taille . si les valeurs d'échantillon sont
6, 9, 3, 8, de
elles seront habituellement dénotées
là où on suppose qu'habituellement le souscrit i dans indique simplement l'ordre dans lequel les observations ont été enregistrées et n'est pas significatif. Un cas quand l'ordre est significatif est quand les observations font partie d'une série chronologique .
Les statistiques d'ordre seraient dénotées
là où l'indice inférieur ( i ) joint entre parenthèses indique la statistique d'ordre de Th du i de l'échantillon.
La première statistique d'ordre de (ou statistique de la commande de ) est toujours le minimum l'échantillon, c., = de
là où, suivant une convention commune, nous employons les lettres majuscules pour nous référer à des variables aléatoires, et à des lettres minuscules (comme ci-dessus) pour se rapporter à leurs valeurs observées réelles.
De même, pour un échantillon du n de taille, la statistique d'ordre de Th du n de (ou statistique d'ordre le plus important de ) est le maximum de , c.,
La gamme témoin de est la différence entre le maximum et le minimum. C'est clairement une fonction des statistiques d'ordre :
Une statistique importante semblable dans l'analyse de données exploratoire qui est simplement liée aux statistiques d'ordre est la gamme interquartile témoin.
Échantillon les mai ou mai médians ne pas être une statistique d'ordre, puisqu'il y a une valeur moyenne simple seulement quand le nombre d'observations est le impair. Plus avec précision, si pour un certain , alors la médiane d'échantillon est et ainsi est une statistique d'ordre. D'une part, quand est le même , et là sont deux valeurs, et , et la médiane d'échantillon est une certaine fonction des deux (habituellement la moyenne) et par conséquent pas une statistique d'ordre. Les remarques semblables s'appliquent à tous les quantiles d'échantillon.
Analyse probabiliste
Donné toutes les variables aléatoires le , le sont également des variables aléatoires, définies en assortissant les valeurs (réalisations ) du dans l'ordre croissant.
Quand le un échantillon , ils sont indépendant et identiquement distribué (iid ). C'est la caisse traitée ci-dessous. Généralement le peut surgir par l'échantillonnage de plus d'une population. Alors ils sont le indépendant mais pas nécessairement identiquement distribué, et leur distribution de probabilité commune est donnée par le Bapat-Prient le théorème .
Dorénavant, nous supposerons que les variables aléatoires sont à l'étude le continu et, lorsque c'est possible nous supposera également qu'elles ont une densité (c'est-à-dire, elles sont le absolument continu). Les particularités de l'analyse des distributions assignant la masse aux points (en particulier, les répartitions discrètes sont discutées à l'extrémité.
Distribution de chaque statistique d'ordre d'une distribution absolument continue
Laisser le soit les variables aléatoires absolument sans interruption distribuées de l'iid et le soit les statistiques d'ordre correspondantes. Laisser le soit la fonction de densité de probabilité et soit la fonction de répartition cumulative du . Alors la densité de probabilité de la statistique du k th peut être trouvée comme suit.
et la somme au-dessus des télescopes , de sorte que toute l'annulation de limites excepté le premier et le bout : droit
et la limite au-dessus de l'underbrace est zéro, ainsi :
Distributions de probabilité des statistiques d'ordre
Dans cette section nous prouvons que les statistiques d'ordre de la distribution uniforme sur l'intervalle unitaire ont des distributions marginales appartenir à la bêta famille du . Nous donnons également une méthode simple pour dériver la distribution commune de tout nombre de statistiques d'ordre, et traduisons finalement ces résultats aux distributions continues arbitraires using le cdf .
Nous supposons dans toute cette section que le est un échantillon aléatoire tirés d'une distribution continue avec le cdf . Dénotant le nous obtenons l'échantillon aléatoire correspondant de la distribution uniforme standard. Noter que les statistiques d'ordre satisfont également le =F_X de .
Les statistiques d'ordre de la distribution uniforme
La probabilité du tombant dans l'intervalle est égale à
c'est-à-dire, la statistique d'ordre de Th du k de la distribution uniforme est une bêta variable aléatoire du .
La preuve de ces rapports est comme suit. Afin du à être entre le u du u et du u +d, il est nécessaire qu'exactement les éléments du k -1 de l'échantillon soient plus petits que le u , et qu'au moins on est entre le u du u et du u +d. La probabilité que plus d'une est dans ce dernier intervalle est déjà , ainsi nous doivent calculer la probabilité qui exactement le k -1, 1 et n - les observations du k tombent dans le , et respectivement. Ceci égales (se référer à la distribution polynôme pour des détails)
et le résultat suit.
Distributions communes
De même, pour le   du i ; <  ; j , la fonction de densité de probabilité commune deux du i   de du U de statistiques d'ordre ; <  ; Le j de du U peut être montré pour être ce qui est (jusqu'aux limites d'évolué que ) la probabilité ce   du i ; &minus ;   ; 1, 1,   du j ; &minus ;   ; 1  ; &minus ;   ; i , 1 et   du n ; &minus ;   ; les éléments témoin du j tombent dans le , , , , respectivement. On raisonne d'une manière entièrement analogue de dériver les distributions communes évoluées. Peut-être étonnant, la densité commune des statistiques d'ordre du n s'avère être le constant : L'one-way pour comprendre ceci est que l'échantillon non commandé a la densité constante égale à 1, et qu'il y a le n ! différentes permutations de l'échantillon correspondant au même ordre des statistiques d'ordre. Ceci est lié au fait ce 1 n ! est le volume de la région