Overfitting

Dans les statistiques , le overfitting adapte un modèle statistique qui a trop de paramètres un absurde et le modèle faux peut s'adapter parfaitement si le modèle a assez de complexité par comparaison à la quantité de données disponibles. Overfitting est généralement identifié pour être une violation du rasoir d'Occam de . Quand les degrés de de liberté dans le choix de paramètre dépassent la teneur en information des données, ceci mène au caractère arbitraire dans les paramètres modèles (adaptés) finaux qui réduit ou détruit la capacité du modèle de généraliser au delà des données convenables. La probabilité d'overfitting dépend non seulement du nombre de paramètres et de données mais également le conformability de la structure modèle avec les données forment, et l'importance de l'erreur modèle comparée au niveau prévu du bruit ou de l'erreur dans les données.

Le concept d'overfitting est important également dans l'étude de machine . Habituellement un algorithme de étude est formé using un certain ensemble d'exemples de formation, c. les situations exemplaires pour lesquelles le rendement désiré est connu. On assume que l'étudiant atteint un état où il pourra également prévoir le rendement correct pour d'autres exemples, de ce fait généralisant aux situations non exposées pendant la formation (basée sur sa polarisation inductive ). Cependant, particulièrement dans les cas où l'étude a été effectuée trop longtemps ou où s'exerçant les exemples sont rares, l'étudiant peut s'ajuster sur les dispositifs aléatoires très spécifiques des données de formation, que n'avoir aucune relation causale à la fonction de cible de . Dans ce processus d'overfitting, l'exécution sur les exemples de formation augmente toujours tandis que l'exécution sur des données invisibles s'aggrave.

Dans les deux statistiques et étude de machine, afin d'éviter d'overfitting, il est nécessaire d'employer les techniques additionnelles (par exemple contre-vérification , arrêtant tôt , priors bayésiens sur des paramètres ou comparaison modèle ), qui peuvent indiquer quand davantage de formation n'est pas ayant pour résultat une meilleure généralisation. Le processus d'overfitting du réseau neurologique pendant la formation est également connu comme overtraining. Dans le traitement de l'étude de , overfitting est évitée en employant une meilleure valeur minimum de soutien.

Littérature


Tetko, I. ; Luik, études de réseau neurologique d'A. Comparaison d'Overfitting et d'Overtraining, J., 1995, 35, 826-833

Voir également

Données de draguant

.

Random links:Frederick I de Württemberg | Osborn, Missouri | Médecine orthomoléculaire | Hamburger végétarien | Overfitting