Support-Vector-Maschine

aus Freepedia, der freien Wissensdatenbank

Das Prinzip der Klassifikation bzw. Mustererkennung mit Support-Vector-Maschinen (SVM) beruht auf dem Finden einer optimal trennenden Hyperebene in einem hochdimensionalen Merkmalsraum - typischerweise mit wesentlich höherer Dimension als der ursprüngliche Merkmalsraum (letzterer wird auch als Eingaberaum bezeichnet). Die Idee dahinter besteht darin, dass mit einer passenden nichtlinearen Abbildung <math> \phi(\cdot) </math> in eine ausreichend hohe Dimension, Daten aus zwei Kategorien stets mit Hilfe einer Hyperebene getrennt werden können. Dieser hochdimensionale Merkmalsraum hat potentiell unendlich viele Dimensionen. Dennoch ist die Berechnung einer Hyperebene möglich, da die SVM so formuliert werden kann, daß die Trainingsdaten nur in Skalarprodukten auftreten. Dieses Skalarprodukt kann durch eine Funktion <math> \kappa : \mathcal X \times \mathcal X \rightarrow \mathbb R </math> ersetzt werden. Diese Funktion wird als Kernel bezeichnet und gibt den Wert des Skalarprodukt <math> \langle \phi(x),\phi(y) \rangle </math> an. <math>\mathcal X</math> bezeichnet hierbei die Menge, aus der die Trainingsdaten entstammen. Diese muß nun nicht mehr <math>\mathbb R</math> sein, sondern kann bei geeignetem Kernel aus beliebigen Objekten (z.B. Graphen, Zeichenketten etc.) bestehen.

Die SVM hat nicht zuletzt deswegen eine große Popularität erlangt, da das zugrunde liegende Optimierungsproblem konvex ist und trotz der großen Flexibilität der Abbildung <math> \phi(\cdot) </math> eine Überanpassung (Overfitting) an den Trainingsdatensatz verhindert und damit eine gute Generalisierung auf neue Daten garantiert wird. Dies wird als strukturelle Risiko-Minimierung bezeichnet. Die Lösung einer SVM ist der Normalenvektor auf die Hyperebene im Merkmalsraum. Dieser ist eine Linearkombination von in den Merkmalsraum abgebildeten Trainingsbeispielen, d.h. <math>\psi = \sum_{i=1}^{n}\alpha_{i}\cdot\phi (x_{i})</math>, wobei die <math>\alpha</math>-Koeffizienten durch das Optimierungsproblem bestimmt werden. Die Eingabebeispiele, für die gilt <math>\alpha_{i}>0</math> heißen Support-Vektoren. Der Klassifikator hat dann die Form: <math>\langle \psi,\phi (x) \rangle + b = \sum_{i=1}^{n}\alpha_{i} k(x_{i},x)+b</math>.

Bild:Svm exp.png

Es handelt sich um eine überwachte Lernmethode aus dem Bereich Maschinelles Lernen.

Die Methodik geht auf V. Vapnik zurück, der 1974 ein Paper über die Prinzipien der Hyperebenentrennung veröffentlichte (Vapnik, V.; Chervonenkis, A. 1974. Theory of Pattern Recognition [auf russisch]. Nauka, Moscow. (Deutsche Übersetzung: Wapnik, W.; Tscherwonenkis, A. 1979. Theorie der Zeichenerkennung, Akademie-Verlag, Berlin.)

Literatur

Weblinks

Software



Views
'Persönliche Werkzeuge
Werkzeuge
Andere Sprachen
Ähnliche Links