Ich benutze einen Klassifikator, der Wahrscheinlichkeiten zurückgibt. Zur Berechnung der AUC verwende ich das pROC R-Paket. Die Ausgabewahrscheinlichkeiten des Klassifikators
Ich benutze einen Klassifikator, der Wahrscheinlichkeiten zurückgibt. Zur Berechnung der AUC verwende ich das pROC R-Paket. Die Ausgabewahrscheinlichkeiten des Klassifikators
Wenn bekannte Dichten sind, aus denen ich simulieren kann, dh für die ein Algorithmus verfügbar ist. und wenn das Produkt integrierbar ist, gibt es einen generischen Ansatz, um aus dieser Produktdichte unter Verwendung von zu simulieren Simulatoren aus dem 's?k ∏ i = 1 f i ( x ) α...
Ich lese gerade das Kapitel über den Kompromiss zwischen Bias-Varianz und den Elementen des statistischen Lernens und bezweifle, dass die Formel auf Seite 29 basiert. Die Daten ergeben sich aus einem Modell, bei dem wobei zufällig ist Zahl mit dem erwarteten Wert und Varianz . Der erwartete...
Mein Setup ist wie folgt: Ich folge den Richtlinien in "Applied Predictive Modeling". Daher habe ich korrelierte Merkmale gefiltert und erhalte am Ende Folgendes: 4900 Datenpunkte im Trainingssatz und 1600 Datenpunkte im Testsatz. Ich habe 26 Funktionen und das Ziel ist eine kontinuierliche...
Forschungsarbeiten zum maschinellen Lernen behandeln Lernen und Inferenz oft als zwei getrennte Aufgaben, aber es ist mir nicht ganz klar, worin der Unterschied besteht. In diesem Buch verwenden sie zum Beispiel Bayes-Statistiken für beide Arten von Aufgaben, liefern jedoch keine Motivation für...
Warum werden beim Training tiefer und flacher neuronaler Netze im Gegensatz zu anderen Metaheuristiken häufig Gradientenmethoden (z. B. Gradientenabstieg, Nesterov, Newton-Raphson) verwendet? Mit Metaheuristik meine ich Methoden wie simuliertes Tempern, Optimierung von Ameisenkolonien usw., die...
Der Mittelwert ist intuitiv nur der Durchschnitt der Beobachtungen. Die Varianz ist, wie stark diese Beobachtungen vom Mittelwert abweichen. Ich möchte wissen, warum die Umkehrung der Varianz als Präzision bekannt ist. Welche Intuition können wir daraus ziehen? Und warum ist die Präzisionsmatrix in...
Das sind keine Hausaufgaben. Ich bin daran interessiert zu verstehen, ob meine Logik bei diesem einfachen Statistikproblem richtig ist. Angenommen, ich habe eine 2-seitige Münze, bei der die Wahrscheinlichkeit, einen Kopf umzudrehen, und die Wahrscheinlichkeit, einen Schwanz umzudrehen, beträgt ....
Ich habe Maraun et al . Gelesen, "Nichtstationäre Gauß-Prozesse im Wavelet-Bereich: Synthese, Abschätzung und signifikante Tests" (2007), die eine Klasse von nichtstationären GPs definieren, die durch Multiplikatoren im Wavelet-Bereich spezifiziert werden können. Eine Realisierung eines solchen GP...
Ich trainiere ein neuronales Netzwerk (Details nicht wichtig), bei dem die Zieldaten ein Winkelvektor sind (zwischen 0 und 2 * pi). Ich suche Rat, wie ich diese Daten verschlüsseln kann. Folgendes versuche ich derzeit (mit begrenztem Erfolg): 1) 1-von-C-Codierung: Ich bin die eingestellten...
Ich habe das Batch-Normalisierungspapier ( 1) gelesen und nicht verstanden, dass es notwendig ist, gleitende Durchschnitte zu verwenden, um die Genauigkeit des Modells zu verfolgen, und selbst wenn ich akzeptiere, dass dies das Richtige ist, verstehe ich es nicht was sie genau tun. Nach meinem...
Ich habe verstanden, wie die Gratregression die Koeffizienten geometrisch gegen Null schrumpft. Außerdem weiß ich, wie man das im speziellen "Orthonormalen Fall" beweist, aber ich bin verwirrt, wie das im allgemeinen Fall über "Spektrale Zerlegung"
Ich habe mich kürzlich für LSTMs interessiert und war überrascht zu erfahren, dass die Gewichte über die Zeit verteilt sind. Ich weiß, dass, wenn Sie die Gewichte über die Zeit teilen, Ihre Eingabezeitsequenzen eine variable Länge haben können. Mit geteilten Gewichten müssen Sie viel weniger...
Ich kenne die Definition der symmetrischen positiv definierten (SPD) Matrix, möchte aber mehr verstehen. Warum sind sie intuitiv so wichtig? Hier ist was ich weiß. Was sonst? Für gegebene Daten ist die Kovarianzmatrix SPD. Die Kovarianzmatrix ist eine wichtige Metrik. Eine intuitive Erklärung...
Seit meiner ersten Wahrscheinlichkeitsklasse habe ich mich über Folgendes gewundert. Die Berechnung der Wahrscheinlichkeiten erfolgt in der Regel über das Verhältnis der "favorisierten Ereignisse" zu den insgesamt möglichen Ereignissen. Beim Würfeln von zwei 6-seitigen Würfeln beträgt die Anzahl...
Ich lese über adaptive MCMC (siehe z. B. Kapitel 4 der Handbuchs von Markov Chain Monte Carlo , Herausgeber Brooks et al., 2011; und auch Andrieu & Thoms, 2008 ). nnnp ( n )p(n)p(n)limn→∞p(n)=0limn→∞p(n)=0\lim_{n \rightarrow \infty} p(n) = 0 Dieses Ergebnis ist (a posteriori) asymptotisch...
Sei ein Wahrscheinlichkeitsraum mit einer Zufallsvariablen und einer -algebra Wir können eine neue Zufallsvariable , die die bedingte Erwartung ist.(Ω,F,μ)(Ω,F,μ)(\Omega,\mathscr{F},\mu)ξ:Ω→Rξ:Ω→R\xi:\Omega \to \mathbb{R}σσ\sigmaG⊆FG⊆F\mathscr{G}\subseteq \mathscr{F}E[ ξ|...
Mir sind die Probleme der schrittweisen / vorwärts / rückwärts Auswahl in Regressionsmodellen gut bekannt. Es gibt zahlreiche Fälle, in denen Forscher die Methoden anprangern und auf bessere Alternativen hinweisen. Ich war gespannt, ob es Geschichten gibt, bei denen eine statistische Analyse...
Ein Spieler erhält einen fairen sechsseitigen Würfel. Um zu gewinnen, muss sie eine Zahl größer als 4 würfeln (dh eine 5 oder eine 6). Wenn sie eine 4 würfelt, muss sie erneut würfeln. Was sind ihre Gewinnchancen? Ich denke, die Wahrscheinlichkeit, P(W)P(W)P(W) , kann rekursiv ausgedrückt werden...
Ich bin nicht sicher, wo diese Frage hingehört: Cross Validated oder The Workplace. Aber meine Frage hängt vage mit der Statistik zusammen. Diese Frage (oder ich nehme an, Fragen) stellte sich während meiner Arbeit als "Praktikant im Bereich Data Science". Ich habe dieses lineare Regressionsmodell...