Bei Datenpunkten mit jeweils Merkmalen werden als und die anderen als . Jedes Merkmal erhält zufällig einen Wert von (gleichmäßige Verteilung). Wie groß ist die Wahrscheinlichkeit, dass es eine Hyperebene gibt, die die beiden Klassen aufteilen kann?d n / 2 0 n / 2 1 [ 0 , 1 ]
Betrachten wir zunächst den einfachsten Fall, .
Antworten:
Vorausgesetzt, die Daten enthalten keine Duplikate.
Wenn , ist die Wahrscheinlichkeit .n ≤ d+ 1 Pr = 1
Für andere Kombinationen von( n , d) siehe das folgende Diagramm:
Ich habe diesen Plot generiert, in dem Eingangs- und Ausgangsdaten wie im OP angegeben simuliert wurden. Die lineare Separierbarkeit wurde aufgrund des Hauck-Donner-Effekts als Konvergenzfehler in einem logistischen Regressionsmodell definiert .
Wir können sehen, dass die Wahrscheinlichkeit abnimmt, wenn zunimmt . Tatsächlich konnten wir ein Modell anpassen, das und in , und dies war das Ergebnis:n n , d p
Code für das Grundstück (in Julia):
Code für das Modell bezüglich zu (in Julia):( n , d) p
quelle