Machine de vecteur de soutien
Les machines de vecteur de soutien (SVMs) de sont un ensemble de relatif dirigé apprendre des méthodes de employées pour la classification et la régression . Elles appartiennent à une famille des classificateurs linéaires généralisés qu'elles peuvent également être considérées un cas spécial de la régularisation de Tikhonov de . Une propriété spéciale de SVMs est qu'elles réduisent au minimum simultanément l'erreur empirique de classification et maximisent la marge géométrique ; par conséquent elles sont également connues en tant que classificateurs maximum de marge de .
Soutenir les vecteurs d'entrée de carte de machines de vecteur à un espace dimensionnel plus élevé où un hyperplan de séparation maximal est construit. Deux hyperplans parallèles sont construits de chaque côté de l'hyperplan qui sépare les données. L'hyperplan de séparation est l'hyperplan qui maximise la distance entre les deux hyperplans parallèles. Une prétention est faite que plus la marge ou la distance entre ces est grande hyperplans parallèles plus l'erreur de généralisation du classificateur sera est meilleure. Un excellent cours d'instruction a été produit par C. Une comparaison du SVM à d'autres classificateurs a été faite par van der Walt et Barnard.
Motivation
Souvent
nous sommes intéressés à classifier des données comme partie d'un processus de machine-étude. Chaque
point de repères sera représenté par un vecteur de
-dimensional (une liste de nombres de
). Chacun de ces
points de repères appartient seulement à un de deux classes.
Nous sommes intéressés dedans si nous pouvons les séparer avec un " ; p sans 1" ; hyperplan dimensionnel . C'est une forme typique du classificateur linéaire . Il y a
beaucoup de classificateurs linéaires qui pourraient satisfaire cette propriété. Cependant, nous sommes en plus intéressés à découvrir si nous pouvons réaliser
la séparation maximum (marge ) entre les deux classes. Par ceci nous voulons dire que nous sélectionnons l'hyperplan de sorte que la distance de l'hyperplan
au point de repères le plus proche soit maximisée. C'est-à-dire que la
distance la plus proche entre un point dans un hyperplan de séparé par et un point dans l'autre hyperplan de séparé par est maximisée. Maintenant, si un tel hyperplan existe, elle est clairement d'intérêt et est connue comme
hyperplan de Maximum-marge de et un classificateur si linéaire est connu comme classificateur maximum de la marge .
Formalisation
Nous considérons des points de repères
de la forme :
là où le i de
du c est 1 ou &minus ; 1, une constante dénotant la classe à laquelle le _i de de