Ich verstehe das so, dass das Modell einzelne Datenpunkte schlecht vorhersagt, aber einen festen Trend festgestellt hat (z. B. steigt y, wenn x
Ich verstehe das so, dass das Modell einzelne Datenpunkte schlecht vorhersagt, aber einen festen Trend festgestellt hat (z. B. steigt y, wenn x
Gibt es eine einfache Möglichkeit zu erklären, warum das Verfahren von Benjamini und Hochberg (1995) tatsächlich die Rate falscher Entdeckungen (FDR) kontrolliert? Dieses Verfahren ist so elegant und kompakt, und dennoch ist der Beweis, warum es in der Unabhängigkeit funktioniert (siehe Anhang...
Ich bin derzeit ein bisschen verwirrt darüber, wie der Mini-Batch-Gefälle-Abstieg in einem Sattelpunkt gefangen werden kann. Die Lösung könnte zu trivial sein, als dass ich sie nicht verstehe. Sie erhalten in jeder Epoche eine neue Stichprobe und es wird ein neuer Fehler basierend auf einer...
Ich vereinfache eine Forschungsfrage, die ich bei der Arbeit habe. Stellen Sie sich vor, ich hätte 5 Münzen und lasst uns Heads als Erfolg bezeichnen. Dies sind SEHR voreingenommene Münzen mit einer Erfolgswahrscheinlichkeit von p = 0,1. Nun, wenn die Münzen unabhängig waren, dann bekommt die...
Ich versuche, ein intuitives Verständnis und Gefühl für den Unterschied und den praktischen Unterschied zwischen dem Begriff konsistent und asymptotisch unvoreingenommen zu bekommen. Ich kenne ihre mathematischen / statistischen Definitionen, suche aber etwas Intuitives. Wenn ich ihre individuellen...
Der Zweck des Papiers bestand darin, einige Parameter durch Maximierung der regulierten Log-Wahrscheinlichkeit zu optimieren. Dann berechnen sie partielle Ableitungen. Und dann erwähnen die Autoren, dass sie die Gleichung mit L-BFGS optimieren, einem Standard-Quasi-Newton-Verfahren zur Optimierung...
β^λ=argminβ∈Rp12n∥y−Xβ∥22+λ∥β∥1,β^λ=argminβ∈Rp12n‖y−Xβ‖22+λ‖β‖1,\hat\beta^\lambda = \arg\min_{\beta \in \mathbb{R}^p} \frac{1}{2n} \|y - X \beta\|_2^2 + \lambda \|\beta\|_1,ithithi^{th}xi∈Rpxi∈Rpx_i \in \mathbb{R}^pX∈Rn×pX∈Rn×pX \in \mathbb{R}^{n \times p}yiyiy_ii=1,…ni=1,…ni=1, \dots n Wir...
(aa wäre einer von vielen, bb wäre nicht) Ich dachte, es wäre 10! / 8! Aber anscheinend mache ich etwas falsch. Kann mir jemand helfen, weil ich ratlos
In der angewandten Forschung wird viel Wert darauf gelegt, Effektgrößen anstelle von p-Werten zu verwenden und anzugeben (z. B. Zitate weiter unten). Ist es aber nicht so, dass eine Effektgröße wie ein p-Wert eine Zufallsvariable ist und daher von Probe zu Probe variieren kann , wenn dasselbe...
Es scheint eine Menge Verwirrung im Vergleich zwischen der Verwendung von glmnetinside caretzur Suche nach einem optimalen Lambda und der Verwendung cv.glmnetderselben Aufgabe zu geben. Viele Fragen wurden gestellt, zB: Klassifizierungsmodell train.glmnet vs. cv.glmnet? Was ist der richtige Weg,...
Das mag eine häufige Frage sein, aber ich habe nie eine zufriedenstellende Antwort gefunden. Wie bestimmen Sie die Wahrscheinlichkeit, dass die Nullhypothese wahr (oder falsch) ist? Angenommen, Sie geben den Schülern zwei verschiedene Versionen eines Tests und möchten feststellen, ob die Versionen...
Kaggles Wettbewerb Die Safe Driver Prediction von Porto Seguro verwendet den normalisierten Gini-Score als Bewertungsmaßstab. Dies hat mich neugierig gemacht, welche Gründe für diese Entscheidung sprechen . Was sind die Vorteile der Verwendung eines normalisierten Gini-Scores anstelle der...
Der universelle Approximationssatz ist ein ziemlich bekanntes Ergebnis für neuronale Netze, das im Grunde besagt, dass unter bestimmten Annahmen eine Funktion durch ein neuronales Netz mit beliebiger Genauigkeit einheitlich approximiert werden kann. Gibt es ein analoges Ergebnis, das für...
Ich bin kein Statistiker, aber ich interessiere mich sehr für Statistik und möchte ein Buch kaufen, um es als Referenz zu behalten. Ich habe ein paar Bücher zu bestimmten Themen (wie The Elements of Statistical Learning für maschinelles Lernen oder Bayesian Data Analysis für ... na ja, Bayesian...
Einige statistische Tests sind robust und andere nicht. Was genau bedeutet Robustheit? Überraschenderweise konnte ich auf dieser Seite keine solche Frage finden. Darüber hinaus werden manchmal die Robustheit und die Leistungsfähigkeit eines Tests gemeinsam erörtert. Und intuitiv konnte ich nicht...
Angenommen, wir haben die Eingabe- (Prädiktor) und Ausgabedatenpunkte (Antwortdatenpunkte) A, B, C, D, E, und wir möchten eine Linie durch die Punkte einpassen. Dies ist ein einfaches Problem, um die Frage zu veranschaulichen, kann aber auch auf höhere Dimensionen ausgedehnt werden. Problemstellung...
Hat eine Familie einer Distribution eine andere Definition für Statistik als in anderen Disziplinen? Im Allgemeinen ist eine Kurvenfamilie ein Satz von Kurven, von denen jede durch eine Funktion oder Parametrisierung gegeben ist, in der einer oder mehrere der Parameter variiert werden. Solche...
Wir stehen vor dem Aufkommen des Quantencomputers , wobei Quantensprachen Hardware-Quantencomputer antizipieren, die jetzt für simulierte Quantencomputer auf hohem und niedrigem Niveau verfügbar sind . Quantum Computing bringt neue elementare Funktionen wie Verschränkung und Teleportation von...
Ich habe zwei Modelle trainiert (binäre Klassifikatoren mit h2o AutoML) und möchte eines zur Verwendung auswählen. Ich habe folgende Ergebnisse: model_id auc logloss logloss_train logloss_valid gini_train gini_valid DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975 DL_grid_2...
Angenommen, wir kennen p (x, y), p (x, z) und p (y, z). Ist es wahr, dass die gemeinsame Verteilung p (x, y, z) identifizierbar ist? Dh, es gibt nur ein mögliches p (x, y, z), das über den Rändern