Ich habe oft vom Fluch der Dimensionalität gehört, aber irgendwie kann ich die Idee immer noch nicht verstehen, es ist alles neblig.
Kann jemand dies auf die intuitivste Weise erklären, wie Sie es einem Kind erklären würden, damit ich (und die anderen, die verwirrt sind, wie ich es bin) diese für immer verstehen können?
BEARBEITEN:
Nehmen wir nun an, das Kind hat irgendwie von Clustern gehört (zum Beispiel wissen sie, wie man ihre Spielsachen zu Clustern zusammenfügt :)). Wie würde die Zunahme der Dimensionalität die Arbeit des Clusterns ihrer Spielzeuge erschweren?
Früher berücksichtigten sie beispielsweise nur die Form des Spielzeugs und die Farbe des Spielzeugs (einfarbiges Spielzeug), jetzt müssen sie jedoch auch die Größe und das Gewicht des Spielzeugs berücksichtigen. Warum fällt es dem Kind schwerer, ähnliches Spielzeug zu finden?
BEARBEITEN 2
Zum Zwecke der Diskussion muss ich klarstellen, dass - "Warum ist es für das Kind schwieriger, ähnliche Spielzeuge zu finden" - ich auch meine, warum der Begriff der Distanz in hochdimensionalen Räumen verloren geht?
Antworten:
Wahrscheinlich wird das Kind gerne Kekse essen, nehmen wir also an, dass Sie einen ganzen LKW mit Keksen haben, die eine andere Farbe, eine andere Form, einen anderen Geschmack, einen anderen Preis haben ...
Wenn das Kind wählen muss, aber nur eine Eigenschaft berücksichtigt, z. B. den Geschmack, dann hat es vier Möglichkeiten: süß, salzig, sauer, bitter, so dass das Kind nur vier Kekse probieren muss, um herauszufinden, was ihm am besten gefällt.
Wenn das Kind Kombinationen von Geschmack und Farbe mag und es 4 (ich bin hier eher optimistisch :-)) verschiedene Farben gibt, dann muss es bereits zwischen 4x4 verschiedenen Typen wählen;
Wenn er zusätzlich die Form der Kekse berücksichtigen möchte und es 5 verschiedene Formen gibt, muss er 4x4x5 = 80 Kekse probieren
Wir könnten weitermachen, aber nachdem er all diese Kekse gegessen hat, hat er vielleicht schon Bauchschmerzen ... bevor er seine beste Wahl treffen kann :-) Abgesehen von den Bauchschmerzen kann es wirklich schwierig werden, sich an die Unterschiede im Geschmack zu erinnern von jedem Cookie.
Wie Sie sehen (@Almo), werden die meisten (alle?) Dinge komplizierter, wenn die Anzahl der Dimensionen zunimmt. Dies gilt für Erwachsene, für Computer und auch für Kinder.
quelle
Die Analogie, die ich gerne für den Fluch der Dimensionalität verwende, ist ein bisschen geometrischer, aber ich hoffe, sie ist für Ihr Kind immer noch ausreichend nützlich.
Es ist einfach, einen Hund zu jagen und ihn vielleicht zu fangen, wenn er in der Ebene herumläuft (zweidimensional). Es ist viel schwieriger, Vögel zu jagen, die jetzt eine zusätzliche Dimension haben, in die sie sich bewegen können. Wenn wir so tun, als wären Geister höherdimensionale Wesen (ähnlich der Sphäre, die mit A. Square in Flatland interagiert ), sind diese noch schwieriger zu fangen. :)
quelle
Ok, also lassen Sie uns das Beispiel des Kindes analysieren, das seine Spielzeuge in Gruppen zusammenfasst.
Stellen Sie sich vor, das Kind hat nur 3 Spielsachen:
Lassen Sie uns die folgende erste Hypothese machen, wie ein Spielzeug hergestellt werden kann:
Jetzt können wir (num_colors * num_shapes) = 3 * 3 = 9 mögliche Cluster haben.
Der Junge würde die Spielzeuge wie folgt gruppieren:
Wenn wir nur diese 2 Dimensionen (Farbe, Form) verwenden, haben wir 2 nicht leere Cluster: In diesem ersten Fall sind 7/9 ~ 77% unseres Raumes leer.
Erhöhen wir nun die Anzahl der Dimensionen, die das Kind berücksichtigen muss. Wir machen auch die folgende Hypothese, wie ein Spielzeug hergestellt werden kann:
Wenn wir unser Spielzeug JETZT in Gruppen zusammenfassen möchten, haben wir (num_colors * num_shapes * num_sizes * num_weights) = 3 * 3 * 10 * 10 = 900 mögliche Gruppen.
Der Junge würde die Spielzeuge wie folgt gruppieren:
Unter Verwendung der aktuellen 4 Dimensionen (Form, Farbe, Größe, Gewicht) sind nur 3 Cluster nicht leer. In diesem Fall sind also 897/900 ~ 99,7% des Raums leer.
Dies ist ein Beispiel für das, was Sie auf Wikipedia finden ( https://en.wikipedia.org/wiki/Curse_of_dimensionality ):
... wenn die Dimensionalität zunimmt, nimmt das Volumen des Raums so schnell zu, dass die verfügbaren Daten spärlich werden.
Bearbeiten: Ich bin nicht sicher, ob ich einem Kind wirklich erklären kann, warum in hochdimensionalen Räumen die Entfernung manchmal falsch ist, aber lassen Sie uns versuchen, mit unserem Beispiel des Kindes und seines Spielzeugs fortzufahren.
Betrachten wir nur die beiden ersten Merkmale {Farbe, Form}, so sind sich alle einig, dass der blaue Ball dem blauen Freesbe ähnlicher ist als dem grünen Würfel. Fügen
wir nun weitere 98 Features hinzu: Größe, Gewicht, Produktionstag, Material, Weichheit, Preis usw. Nun, es würde mir immer schwerer fallen, zu beurteilen, welches Spielzeug welchem ähnlich ist.
Damit:
Wenn Sie mir zuhören, ist ein guter Vortrag "Ein paar nützliche Dinge, die Sie über maschinelles Lernen wissen sollten" ( http://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf ), insbesondere Absatz 6 Art von Argumentation.
Hoffe das hilft!
quelle
Ich bin auf den folgenden Link gestoßen, der eine sehr intuitive (und detaillierte) Erklärung für den Fluch der Dimensionalität bietet: http://www.visiondummy.com/2014/04/curse-dimensionality-affect-classification/
Mit wenigen Worten, dieser Artikel leitet (intuitiv) ab, dass das Hinzufügen weiterer Features (dh das Erhöhen der Dimensionalität unseres Feature-Space) das Sammeln weiterer Daten erfordert. Tatsächlich wächst die Datenmenge, die wir sammeln müssen (um eine Überanpassung zu vermeiden), exponentiell, wenn wir weitere Dimensionen hinzufügen.
Es hat auch schöne Abbildungen wie die folgende:
quelle
Der Fluch der Dimensionalität ist in seiner Definition etwas verschwommen, da er verschiedene, aber verwandte Dinge in verschiedenen Disziplinen beschreibt. Das Folgende veranschaulicht den Fluch der Dimensionalität des maschinellen Lernens:
Angenommen, ein Mädchen hat zehn Spielzeuge, von denen es nur die in Kursivschrift mag:
Jetzt möchte ihr Vater ihr ein neues Spielzeug zum Geburtstag schenken und dafür sorgen, dass es ihr gefällt. Er überlegt sehr genau, was die Spielsachen, die sie mag, gemeinsam haben und kommt schließlich zu einer Lösung. Er gibt seiner Tochter ein buntes Puzzle. Wenn sie es nicht mag, antwortet er: „Warum magst du es nicht? Es enthält den Buchstaben w. "
Der Vater ist dem Fluch der Dimensionalität (und der In-Sample-Optimierung) zum Opfer gefallen. Durch die Betrachtung von Buchstaben bewegte er sich in einem 26-dimensionalen Raum und so war es sehr wahrscheinlich, dass er ein Kriterium finden würde, das die von der Tochter geliebten Spielzeuge voneinander trennt. Dies musste nicht wie im Beispiel ein Einbuchstabenkriterium sein, sondern hätte auch so etwas sein können
Um zu beurteilen, ob Buchstaben ein gutes Kriterium für die Entscheidung sind, welches Spielzeug seine Tochter mag, müsste der Vater die Vorlieben seiner Tochter für eine gigantische Menge an Spielzeug kennen¹ - oder einfach sein Gehirn benutzen und nur Parameter berücksichtigen, die tatsächlich für die Tochter denkbar sind Meinung.
quelle
quelle
Ich: "Ich denke an ein kleines braunes Tier, das mit 'S' beginnt. Was ist das?"
Sie: "Eichhörnchen!"
Ich: "Okay, härter. Ich denke an ein kleines braunes Tier. Was ist das?"
Sie: "Immer noch ein Eichhörnchen?"
Ich nein"
Sie: "Ratte, Maus, Wühlmaus?
Ich: "Nein"
Sie: "Ähm ... gib mir einen Hinweis"
Ich: "Nein, aber ich werde einiges besser machen: Ich lasse Sie auf eine CrossValidated-Frage antworten."
Sie: [stöhnt]
Ich: "Die Frage ist: Was ist der Fluch der Dimensionalität? Und du kennst bereits die Antwort."
Sie: "Tue ich?"
Ich: "Das tust du. Warum war es schwieriger, das erste Tier zu erraten als das zweite?"
Sie: "Weil es mehr kleine braune Tiere gibt als kleine braune Tiere, die mit 'S' beginnen?"
Ich: "Richtig. Und das ist der Fluch der Dimensionalität. Lass uns noch einmal spielen."
Sie: "OK"
Ich: "Ich denke an etwas. Was ist das?"
Sie: "Nein, fair. Dieses Spiel ist viel zu schwer."
Ich: "Stimmt. Deshalb nennen sie es einen Fluch. Man kann es einfach nicht gut machen, ohne die Dinge zu kennen, über die ich nachdenke."
quelle
Angenommen, Sie möchten einige Waren versenden. Sie möchten beim Verpacken der Waren so wenig Platz wie möglich verschwenden (dh so wenig Platz wie möglich lassen), da sich die Versandkosten auf das Volumen des Umschlags / der Schachtel beziehen. Die zur Verfügung stehenden Behälter (Umschläge, Kisten) haben einen rechten Winkel, also keine Säcke usw.
Erstes Problem: Versenden Sie einen Stift (eine "Linie") - Sie können eine Kiste um ihn herum bauen, ohne dass Platz verloren geht.
Zweites Problem: Versenden Sie eine CD (eine "Kugel"). Sie müssen es in einen quadratischen Umschlag stecken. Je nachdem, wie alt das Kind ist, kann es möglicherweise berechnen, wie viel des Umschlags leer bleibt (und weiß immer noch, dass es CDs und nicht nur Downloads gibt ;-)).
Drittes Problem: Schiff einen Fußball (Fußball, und es muss aufgeblasen werden!). Sie müssen es in eine Schachtel legen, und etwas Platz bleibt leer. Dieser leere Bereich macht einen höheren Anteil des Gesamtvolumens aus als im CD-Beispiel.
An diesem Punkt hört meine Intuition mit dieser Analogie auf, weil ich mir keine vierte Dimension vorstellen kann.
BEARBEITEN: Die Analogie ist (wenn überhaupt) für die nichtparametrische Schätzung am nützlichsten, bei der Beobachtungen "lokal" bis zum interessierenden Punkt verwendet werden, um beispielsweise eine Dichte- oder eine Regressionsfunktion an diesem Punkt zu schätzen. Der Fluch der Dimensionalität ist, dass man in höheren Dimensionen entweder eine viel größere Nachbarschaft für eine bestimmte Anzahl von Beobachtungen (was den Begriff der Lokalität in Frage stellt) oder eine große Datenmenge benötigt.
quelle
Mein 6. Lebensjahr ist mehr auf den Vers der Primärursachenforschung ausgerichtet, wie in "Aber woher kam all dieses Gas im Universum?" ... nun, ich kann mir vorstellen, dass Ihr Kind "höhere Dimensionen" versteht, was sehr scheint unwahrscheinlich für mich.
Jetzt hol dein Zimmer ab, Papa muss arbeiten.
quelle
Es gibt ein klassisches mathematisches Lehrbuchproblem, das dies zeigt.
Möchten Sie lieber (Option 1) 100 Cent pro Tag verdienen, jeden Tag für einen Monat, oder (Option 2) jeden Tag einen verdoppelten Cent für einen Monat? Sie können Ihrem Kind diese Frage stellen.
Wenn Sie Option 1 wählen, erhalten Sie
am ersten Tag 100 Pennys. Am zweiten Tag erhalten Sie 100 Pennys. Am dritten Tag erhalten Sie 100 Pennys. Am 30. Tag erhalten Sie 100 Pennys
Die Gesamtzahl der Pfennige ergibt sich aus der Multiplikation der Anzahl der Tage mit der Anzahl der Pfennige pro Tag:
Wenn Sie Option 2 wählen:
Am 1. Tag erhalten Sie 1 Cent am 2. Tag erhalten Sie 2 Cent am 3. Tag erhalten Sie 4 Cent am 4. Tag erhalten Sie 8 Cent am 5. Tag erhalten Sie 16 Cent ... am 30. Tag erhalten Sie 1.073.741.824 Pennies
Jeder mit Gier wird die größere Zahl wählen. Einfache Gier ist leicht zu finden und erfordert wenig Nachdenken. Unaussprechliche Tiere sind leicht zu Gier fähig - Insekten sind dafür berüchtigt. Der Mensch kann viel mehr.
Wenn Sie mit einem Penny anstelle von hundert anfangen, ist die Gier einfacher, aber wenn Sie die Potenz für ein Polynom ändern, ist sie komplexer. Komplex kann auch viel wertvoller sein.
Über "den Fluch"
Die "wichtigste" physikalisch-mathematische Operation ist die Matrixinversion. Es treibt Lösungen von Systemen partieller Differentialgleichungen an, von denen die häufigsten Maxwell-Gleichungen (Elektromagnetik), Navier-Stokes-Gleichungen (Flüssigkeiten), Poisson-Gleichung (Diffusionsübertragung) und Variationen des Hookes-Gesetzes (deformierbare Feststoffe) sind. Um jede dieser Gleichungen sind Universitätskurse aufgebaut.
Der Fluch existiert, denn wenn er überwunden ist, befindet sich am Ende des Regenbogens ein Topf mit goldenem Wert. Es ist nicht einfach - große Köpfe haben sich intensiv mit dem Problem befasst.
Verknüpfung:
quelle
Fcop bot eine großartige Analogie zu Cookies, deckte jedoch nur den Aspekt der Abtastdichte des Fluches der Dimensionalität ab. Wir können diese Analogie auf das Stichprobenvolumen oder die Entfernung ausweiten, indem wir die gleiche Anzahl von Fcop-Keksen in z. B. zehn Kisten in einer Zeile, 10x10 Kisten flach auf dem Tisch und 10x10x10 in einem Stapel verteilen. Dann können Sie zeigen, dass das Kind immer mehr Kisten öffnen muss, um den gleichen Anteil an Keksen zu essen.
Es geht wirklich um die Erwartungen, aber lassen Sie uns einen "Worst-Case-Szenario" -Ansatz verwenden, um dies zu veranschaulichen.
Wenn es 8 Kekse gibt und wir eine Hälfte essen möchten, dh 4, von 10 Kisten müssen wir im schlimmsten Fall nur 6 Kisten öffnen. Das sind 60% - auch nur etwa die Hälfte. Ab 10x10 (im schlimmsten Fall erneut) - 96 (%). Und von 10x10x10 - 996 (99,6%). Das sind fast alle!
Vielleicht ist die Analogie zum Lagerraum und die Entfernung, die zwischen den Räumen zurückgelegt wird, hier besser als bei Kisten.
quelle