Es gibt verschiedene Verwendungszwecke: Schätzung der Kerndichte Kernel-Trick Kernel-Glättung Bitte erläutern Sie, was der "Kernel" in ihnen im Klartext in Ihren eigenen Worten
Es gibt verschiedene Verwendungszwecke: Schätzung der Kerndichte Kernel-Trick Kernel-Glättung Bitte erläutern Sie, was der "Kernel" in ihnen im Klartext in Ihren eigenen Worten
Inspiriert von einem Kommentar zu dieser Frage : Was halten wir in einem Prior für "uninformativ" - und welche Informationen sind in einem vermeintlich uninformativen Prior noch enthalten? Im Allgemeinen sehe ich den Prior in einer Analyse, bei der es sich entweder um eine Analyse vom Typ eines...
Ich habe in der Zusammenfassung dieses Papiers gelesen, dass: "Das Maximum Likelihood (ML) -Verfahren von Hartley aud Rao wird durch Anpassen einer Transformation von Patterson und Thompson modifiziert, bei der die Wahrscheinlichkeitsrendernormalität in zwei Teile aufgeteilt wird, von denen einer...
Ich habe mich eine Zeit lang sehr für Data-Mining und maschinelles Lernen interessiert , zum Teil, weil ich in der Schule einen Schwerpunkt in diesem Bereich hatte, aber auch, weil ich wirklich viel aufgeregter bin, Probleme zu lösen, die ein bisschen mehr Gedanken erfordern als nur Programmieren...
Häufig erhält ein statistischer Analytiker einen Datensatz und wird gebeten, ein Modell mit einer Technik wie der linearen Regression anzupassen. Sehr häufig wird der Datensatz mit einem Haftungsausschluss in der Art von "Oh ja, wir haben es vermasselt, einige dieser Datenpunkte zu sammeln - tun...
Am 25. Februar 2015 hat die Zeitschrift Basic and Applied Social Psychology einen Leitartikel herausgegeben , der Werte und Konfidenzintervalle aus allen zukünftigen Veröffentlichungen verbietet .ppp Konkret heißt es (Formatierung und Hervorhebung gehören mir): [...] vor der Veröffentlichung...
In den letzten Jahren sind neuronale Faltungsnetze (oder vielleicht auch tiefe neuronale Netze im Allgemeinen) immer tiefer geworden, wobei die Netze auf dem neuesten Stand der Technik von 7 Schichten ( AlexNet ) auf 1000 Schichten ( Residual Nets) innerhalb von 4 Schichten übergegangen sind Jahre....
Ich versuche den Unterschied zwischen verschiedenen Resampling-Methoden (Monte-Carlo-Simulation, parametrisches Bootstrapping, nicht-parametrisches Bootstrapping, Jackknifing, Kreuzvalidierung, Randomisierungstests und Permutationstests) und deren Implementierung in meinem eigenen Kontext mithilfe...
Wenn Sie die Clusteranalyse für einen Datensatz verwenden, um ähnliche Fälle zu gruppieren, müssen Sie aus einer Vielzahl von Clustermethoden und Entfernungsmaßen auswählen. Manchmal kann eine Wahl die andere beeinflussen, aber es gibt viele mögliche Kombinationen von Methoden. Hat jemand...
In letzter Zeit habe ich viel über die Unterschiede zwischen der Fisher-Methode zum Testen von Hypothesen und der Neyman-Pearson-Denkschule gelesen. Meine Frage ist, für einen Moment philosophische Einwände zu ignorieren; Wann sollten wir den Fisher-Ansatz der statistischen Modellierung anwenden...
Gibt es eine GUI für R, die es Anfängern erleichtert, in dieser Sprache zu lernen und zu
PSYs Musikvideo "Gangnam Style" ist beliebt, nach etwas mehr als 2 Monaten hat es etwa 540 Millionen Zuschauer. Ich habe das letzte Woche von meinen jugendlichen Kindern beim Abendessen erfahren und bald ging die Diskussion dahin, ob es möglich ist, eine Art Vorhersage darüber zu treffen, wie viele...
Ich nehme an den Online-Kursen für maschinelles Lernen teil und habe etwas über Gradient Descent gelernt, um die optimalen Werte in der Hypothese zu berechnen. h(x) = B0 + B1X Warum müssen wir Gradient Descent verwenden, wenn wir die Werte mit der folgenden Formel leicht finden können? Das sieht...
Was sind die üblichen Annahmen für eine lineare Regression? Umfassen sie: eine lineare Beziehung zwischen der unabhängigen und abhängigen Variablen unabhängige Fehler Normalverteilung von Fehlern Homoskedastizität Gibt es noch
Ich frage mich, wie man Genauigkeits- und Rückrufmaße für die Multiklassen-Multilabel-Klassifizierung berechnet, dh eine Klassifizierung, bei der es mehr als zwei Labels gibt und bei der jede Instanz mehrere Labels haben
Ich habe irgendwo gesehen, dass klassische Entfernungen (wie die euklidische Entfernung) schwach diskriminierend werden, wenn wir mehrdimensionale und spärliche Daten haben. Warum? Haben Sie ein Beispiel für zwei spärliche Datenvektoren, bei denen die euklidische Distanz nicht gut funktioniert? In...
Die Wartezeiten für die Poissonverteilung sind eine Exponentialverteilung mit dem Parameter Lambda. Aber ich verstehe es nicht. Poisson modelliert beispielsweise die Anzahl der Ankünfte pro Zeiteinheit. In welcher Beziehung steht dies zur Exponentialverteilung? Nehmen wir an, die Wahrscheinlichkeit...
Hintergrund : Ich habe keine formelle Ausbildung in Bayes'scher Statistik (obwohl ich sehr daran interessiert bin, mehr zu lernen), aber ich weiß genug - glaube ich - um zu verstehen, warum viele das Gefühl haben, sie seien häufigen Statistiken vorzuziehen. Sogar die Studenten der Einführungsklasse...
Shannons Entropie ist das Negativ der Summe der Wahrscheinlichkeiten jedes Ergebnisses multipliziert mit dem Logarithmus der Wahrscheinlichkeiten für jedes Ergebnis. Welchen Zweck erfüllt der Logarithmus in dieser Gleichung? Eine intuitive oder visuelle Antwort (im Gegensatz zu einer zutiefst...
Im Rahmen eines sozialwissenschaftlichen Forschungsvorschlags wurde mir folgende Frage gestellt: Ich bin immer um 100 + m (wobei m die Anzahl der Prädiktoren ist) gegangen, wenn ich die minimale Stichprobengröße für die multiple Regression bestimmt habe. Ist das angebracht Ich bekomme oft...