Statistiken und Big Data

14

Was bedeutet es, dass eine lineare Regression statistisch signifikant ist, aber ein sehr niedriges Quadrat aufweist?

Ich verstehe das so, dass das Modell einzelne Datenpunkte schlecht vorhersagt, aber einen festen Trend festgestellt hat (z. B. steigt y, wenn x

14

Eine intuitive Erklärung, warum das Benjamini-Hochberg-FDR-Verfahren funktioniert?

Gibt es eine einfache Möglichkeit zu erklären, warum das Verfahren von Benjamini und Hochberg (1995) tatsächlich die Rate falscher Entdeckungen (FDR) kontrolliert? Dieses Verfahren ist so elegant und kompakt, und dennoch ist der Beweis, warum es in der Unabhängigkeit funktioniert (siehe Anhang...

intuition false-discovery-rate teaching

14

Wie kann es in einem Sattelpunkt gefangen werden?

Ich bin derzeit ein bisschen verwirrt darüber, wie der Mini-Batch-Gefälle-Abstieg in einem Sattelpunkt gefangen werden kann. Die Lösung könnte zu trivial sein, als dass ich sie nicht verstehe. Sie erhalten in jeder Epoche eine neue Stichprobe und es wird ein neuer Fehler basierend auf einer...

gradient-descent sgd

14

Korrelierte Bernoulli-Studien, multivariate Bernoulli-Verteilung?

Ich vereinfache eine Forschungsfrage, die ich bei der Arbeit habe. Stellen Sie sich vor, ich hätte 5 Münzen und lasst uns Heads als Erfolg bezeichnen. Dies sind SEHR voreingenommene Münzen mit einer Erfolgswahrscheinlichkeit von p = 0,1. Nun, wenn die Münzen unabhängig waren, dann bekommt die...

multivariate-analysis bernoulli-distribution copula

14

Intuitives Verständnis des Unterschieds zwischen konsistent und asymptotisch unvoreingenommen

Ich versuche, ein intuitives Verständnis und Gefühl für den Unterschied und den praktischen Unterschied zwischen dem Begriff konsistent und asymptotisch unvoreingenommen zu bekommen. Ich kenne ihre mathematischen / statistischen Definitionen, suche aber etwas Intuitives. Wenn ich ihre individuellen...

bias convergence unbiased-estimator asymptotics intuition

14

Wie funktioniert das L-BFGS?

Der Zweck des Papiers bestand darin, einige Parameter durch Maximierung der regulierten Log-Wahrscheinlichkeit zu optimieren. Dann berechnen sie partielle Ableitungen. Und dann erwähnen die Autoren, dass sie die Gleichung mit L-BFGS optimieren, einem Standard-Quasi-Newton-Verfahren zur Optimierung...

algorithms optimization

14

Was ist das kleinste

β^λ=argminβ∈Rp12n∥y−Xβ∥22+λ∥β∥1,β^λ=arg⁡minβ∈Rp12n‖y−Xβ‖22+λ‖β‖1,\hat\beta^\lambda = \arg\min_{\beta \in \mathbb{R}^p} \frac{1}{2n} \|y - X \beta\|_2^2 + \lambda \|\beta\|_1,ithithi^{th}xi∈Rpxi∈Rpx_i \in \mathbb{R}^pX∈Rn×pX∈Rn×pX \in \mathbb{R}^{n \times p}yiyiy_ii=1,…ni=1,…ni=1, \dots n Wir...

lasso regularization

14

Wie viele 2-Buchstaben-Wörter können Sie von aabcccddef erhalten

(aa wäre einer von vielen, bb wäre nicht) Ich dachte, es wäre 10! / 8! Aber anscheinend mache ich etwas falsch. Kann mir jemand helfen, weil ich ratlos

self-study combinatorics

14

Sind die Effektgrößen den p-Werten wirklich überlegen?

In der angewandten Forschung wird viel Wert darauf gelegt, Effektgrößen anstelle von p-Werten zu verwenden und anzugeben (z. B. Zitate weiter unten). Ist es aber nicht so, dass eine Effektgröße wie ein p-Wert eine Zufallsvariable ist und daher von Probe zu Probe variieren kann , wenn dasselbe...

hypothesis-testing confidence-interval p-value effect-size

14

Caret glmnet vs cv.glmnet

Es scheint eine Menge Verwirrung im Vergleich zwischen der Verwendung von glmnetinside caretzur Suche nach einem optimalen Lambda und der Verwendung cv.glmnetderselben Aufgabe zu geben. Viele Fragen wurden gestellt, zB: Klassifizierungsmodell train.glmnet vs. cv.glmnet? Was ist der richtige Weg,...

r caret glmnet machine-learning neural-networks maximum softmax probability distributions mathematical-statistics random-variable cdf statistical-significance variance expected-value ratio sample-size reliability tolerance-interval wilcoxon-signed-rank self-study variance sampling mean machine-learning svm libsvm self-study sampling ranks data-visualization histogram machine-learning classification normal-distribution mathematical-statistics maximum-likelihood mixture predictive-models prediction seasonality

14

Wahrscheinlichkeit, dass die Nullhypothese wahr ist

Das mag eine häufige Frage sein, aber ich habe nie eine zufriedenstellende Antwort gefunden. Wie bestimmen Sie die Wahrscheinlichkeit, dass die Nullhypothese wahr (oder falsch) ist? Angenommen, Sie geben den Schülern zwei verschiedene Versionen eines Tests und möchten feststellen, ob die Versionen...

probability hypothesis-testing bayesian

14

Warum sollte der normalisierte Gini-Score anstelle der AUC als Bewertung verwendet werden?

Kaggles Wettbewerb Die Safe Driver Prediction von Porto Seguro verwendet den normalisierten Gini-Score als Bewertungsmaßstab. Dies hat mich neugierig gemacht, welche Gründe für diese Entscheidung sprechen . Was sind die Vorteile der Verwendung eines normalisierten Gini-Scores anstelle der...

classification auc model-evaluation gini

14

Universeller Approximationssatz für Faltungsnetzwerke

Der universelle Approximationssatz ist ein ziemlich bekanntes Ergebnis für neuronale Netze, das im Grunde besagt, dass unter bestimmten Annahmen eine Funktion durch ein neuronales Netz mit beliebiger Genauigkeit einheitlich approximiert werden kann. Gibt es ein analoges Ergebnis, das für...

neural-networks conv-neural-network approximation

14

Die Wahl zwischen "Statistik" von Freedman et al. Und "Statistische Modelle: Theorie und Praxis" von Freedman

Ich bin kein Statistiker, aber ich interessiere mich sehr für Statistik und möchte ein Buch kaufen, um es als Referenz zu behalten. Ich habe ein paar Bücher zu bestimmten Themen (wie The Elements of Statistical Learning für maschinelles Lernen oder Bayesian Data Analysis für ... na ja, Bayesian...

references

14

Was ist ein robuster statistischer Test? Was ist ein leistungsfähiger statistischer Test?

Einige statistische Tests sind robust und andere nicht. Was genau bedeutet Robustheit? Überraschenderweise konnte ich auf dieser Seite keine solche Frage finden. Darüber hinaus werden manchmal die Robustheit und die Leistungsfähigkeit eines Tests gemeinsam erörtert. Und intuitiv konnte ich nicht...

statistical-significance power robust

14

Warum verwendet die lineare Regression eine Kostenfunktion, die auf dem vertikalen Abstand zwischen der Hypothese und dem Eingabedatenpunkt basiert?

Angenommen, wir haben die Eingabe- (Prädiktor) und Ausgabedatenpunkte (Antwortdatenpunkte) A, B, C, D, E, und wir möchten eine Linie durch die Punkte einpassen. Dies ist ein einfaches Problem, um die Frage zu veranschaulichen, kann aber auch auf höhere Dimensionen ausgedehnt werden. Problemstellung...

regression linear fitting cost-maximization

14

Definition der Familie einer Distribution?

Hat eine Familie einer Distribution eine andere Definition für Statistik als in anderen Disziplinen? Im Allgemeinen ist eine Kurvenfamilie ein Satz von Kurven, von denen jede durch eine Funktion oder Parametrisierung gegeben ist, in der einer oder mehrere der Parameter variiert werden. Solche...

distributions terminology parametric exponential-family

14

Welche Arten von statistischen Problemen dürften von Quantencomputern profitieren?

Wir stehen vor dem Aufkommen des Quantencomputers , wobei Quantensprachen Hardware-Quantencomputer antizipieren, die jetzt für simulierte Quantencomputer auf hohem und niedrigem Niveau verfügbar sind . Quantum Computing bringt neue elementare Funktionen wie Verschränkung und Teleportation von...

quantum-computing

14

logloss vs gini / auc

Ich habe zwei Modelle trainiert (binäre Klassifikatoren mit h2o AutoML) und möchte eines zur Verwendung auswählen. Ich habe folgende Ergebnisse: model_id auc logloss logloss_train logloss_valid gini_train gini_valid DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975 DL_grid_2...

model-selection validation auc gini log-loss

14

Kann eine 3D-Fugenverteilung durch 2D-Ränder rekonstruiert werden?

Angenommen, wir kennen p (x, y), p (x, z) und p (y, z). Ist es wahr, dass die gemeinsame Verteilung p (x, y, z) identifizierbar ist? Dh, es gibt nur ein mögliches p (x, y, z), das über den Rändern

distributions mathematical-statistics