Statistiken und Big Data

9

Für welches Problem oder Spiel sind Varianz und Standardabweichung optimale Lösungen?

Für eine bestimmte Zufallsvariable (oder eine Population oder einen stochastischen Prozess) ist die mathematische Erwartung die Antwort auf eine Frage. Welche Punktprognose minimiert den erwarteten quadratischen Verlust? . Es ist auch die optimale Lösung für ein Spiel. Erraten Sie die nächste...

9

Warum Lasso für die Funktionsauswahl?

Angenommen, ich habe einen hochdimensionalen Datensatz und möchte eine Feature-Auswahl durchführen. Eine Möglichkeit besteht darin, ein Modell zu trainieren, das die wichtigsten Merkmale in diesem Datensatz identifizieren kann, und dieses zu verwenden, um die am wenigsten wichtigen wegzuwerfen. In...

feature-selection linear-model lasso ridge-regression

9

Regression logistischer Regressionsreste auf anderen Regressoren

Wenn die OLS-Regression auf die kontinuierliche Antwort angewendet wird, kann die multiple Regressionsgleichung aufgebaut werden, indem nacheinander Regressionen der Residuen auf jeder Kovariate ausgeführt werden. Meine Frage ist, gibt es eine Möglichkeit, dies mit logistischer Regression über...

regression logistic residuals

9

Hat die Funktion einen Standardnamen?

Hat eine Funktion in der Form einen Standardnamen? ZB ist eine lineare Funktion.ex/ (1+ ex)ex/.(1+ex)e^x/(1+e^x)y= a + b xy=ein+bxy = a +

logistic neural-networks deep-learning terminology

9

Verteilung der Exponentialsumme

Sei X1X1X_1 und X2X2X_2 unabhängige und identisch verteilte exponentielle Zufallsvariablen mit der Rate λλ\lambda . Sei S2=X1+X2S2=X1+X2S_2 = X_1 + X_2 . F: Zeigen Sie, dass S2S2S_2 PDF hat. fS2(x)=λ2xe−λx,x≥0fS2(x)=λ2xe−λx,x≥0f_{S_2}(x) = \lambda^2 x \text{e}^{-\lambda x},\, x\ge 0 . Es ist zu...

self-study distributions convolution exponential-distribution

9

Wann ist die Momenterzeugungsfunktion der charakteristischen Funktion vorzuziehen?

Sei ein Wahrscheinlichkeitsraum und sei ein Zufallsvektor. Sei die Verteilung von , einem Borel-Maß für .(Ω,F,P)(Ω,F,P)(\Omega, \mathcal{F}, P)X:Ω→RnX:Ω→RnX : \Omega \to \mathbb{R}^nPX=X∗PPX=X∗PP_X = X_* PXXXRnRn\mathbb{R}^n Die charakteristische Funktion von ist die Funktion definiert für (die...

mgf characteristic-function

9

Optimierung des Gefälles

Ich versuche, die Gradientenabstiegsoptimierung in ML-Algorithmen (Machine Learning) zu verstehen. Ich verstehe , dass es eine Kostenfunktion-wo das Ziel ist , den Fehler zu minimieren . In einem Szenario, in dem die Gewichte optimiert werden, um den minimalen Fehler zu ergeben, und partielle...

optimization gradient-descent

9

Wie schaffen es Kinder, ihre Eltern in einer PCA-Projektion eines GWAS-Datensatzes zusammenzubringen?

Nehmen Sie 20 zufällige Punkte in einem 10.000-dimensionalen Raum mit jeder Koordinate iid aus . Teilen Sie sie in 10 Paare ("Paare") auf und addieren Sie den Durchschnitt jedes Paares ("ein Kind") zum Datensatz. Führen Sie dann PCA für die resultierenden 30 Punkte durch und zeichnen Sie PC1 gegen...

pca python high-dimensional genetics gwas

9

Wer hat Recht, der Statistiker oder der Chirurg?

Betrachten Sie den unten beschriebenen Fall von Peacock (1972). Diese Passage scheint zu implizieren, dass der junge Statistiker eine kluge, korrekte Aussage macht. Aber ist er?

experiment-design clinical-trials

9

Warum gehen Informationen über die Validierungsdaten verloren, wenn ich beim Optimieren von Hyperparametern die Modellleistung anhand von Validierungsdaten bewerte?

In François Chollets Deep Learning with Python heißt es: Infolgedessen kann das Optimieren der Konfiguration des Modells basierend auf seiner Leistung im Validierungssatz schnell zu einer Überanpassung an den Validierungssatz führen, obwohl Ihr Modell niemals direkt darauf trainiert wird. Zentral...

neural-networks cross-validation hyperparameter

9

Sind unverzerrte effiziente Schätzer stochastisch dominant gegenüber anderen (mittleren) unverzerrten Schätzern?

Allgemeine Beschreibung Maximiert ein effizienter Schätzer (dessen Stichprobenvarianz gleich der Cramér-Rao-Grenze ist) die Wahrscheinlichkeit, nahe am wahren Parameter ?θθ\theta Angenommen, wir vergleichen die Differenz oder die absolute Differenz zwischen der Schätzung und dem wahren ParameterΔ^=...

mathematical-statistics unbiased-estimator sufficient-statistics stochastic-ordering

9

Strategien zur Zeitreihenprognose für 2000 verschiedene Produkte?

Zunächst stelle ich fest, dass meine Frage sehr weit gefasst ist und es daher schwierig sein kann, diese Frage zu beantworten. Haben Sie Ratschläge, wie Sie sich einem „Problem“ nähern können, bei dem Sie Prognosen / Prognosen für mehr als 2000 verschiedene Produkte erstellen müssen? Mit anderen...

time-series forecasting segmentation

9

Warum ist die logistische Regression gut kalibriert und wie kann ihre Kalibrierung ruiniert werden?

In den Scikit-Lerndokumenten zur Wahrscheinlichkeitskalibrierung vergleichen sie die logistische Regression mit anderen Methoden und stellen fest, dass die zufällige Gesamtstruktur weniger gut kalibriert ist als die logistische Regression. Warum ist die logistische Regression gut kalibriert? Wie...

regression logistic calibration

9

Überprüfen, ob eine Münze fair ist

Die folgende Frage wurde mir von einem Freund gestellt. Ich konnte ihr nicht helfen, aber ich hoffe, jemand kann es mir erklären. Ich konnte kein ähnliches Beispiel finden. Vielen Dank für Hilfe und Erklärung. F: Die Ergebnisse von 100 Münzwurfversuchen werden als 0 = "Schwanz" und 1 = "Kopf"...

probability inference bernoulli-distribution

9

Warum konzentriert sich der Bayes'sche Posterior um den Minimierer der KL-Divergenz?

Betrachten Sie die Bayes - posterior θ∣Xθ∣X\theta\mid X . Asymptotisch tritt ihr Maximum bei der Schätzung MLE θ , der nur die Wahrscheinlichkeit maximiert argmin θθ^θ^\hat \thetaargminθfθ(X)argminθfθ(X)\operatorname{argmin}_\theta\, f_\theta(X) . Alle diese Konzepte - Bayesianische Prioritäten,...

bayesian maximum-likelihood kullback-leibler

9

Unsicherheitsschätzung bei hochdimensionalen Inferenzproblemen ohne Abtastung?

Ich arbeite an einem hochdimensionalen Inferenzproblem (ca. 2000 Modellparameter), für das wir eine MAP-Schätzung robust durchführen können, indem wir das globale Maximum des log-posterior unter Verwendung einer Kombination aus gradientenbasierter Optimierung und einem genetischen Algorithmus...

bayesian uncertainty high-dimensional variational-bayes

9

Wahrscheinlichkeit von

Angenommen, und sind unabhängige geometrische Zufallsvariablen mit dem Parameter . Wie ist die Wahrscheinlichkeit, dass ?X1X1X_1X2X2X_2pppX1≥X2X1≥X2X_1 \geq X_2 Ich bin verwirrt über diese Frage, weil uns nichts anderes über und gesagt wird, als dass sie geometrisch sind. Wäre das nicht weil und...

self-study random-variable geometric-distribution

9

Ausfall in der linearen Regression

Ich habe das Originalpapier über Dropout ( https://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf ) gelesen und im Abschnitt über lineare Regression heißt es: E.R ∼ B e r n o u l l i ( p )[ ∥ y - ( R ∗ X.) w∥2]]E.R.∼B.ernÖullich(p)[‖y - -(R.∗X.)w‖2]]\mathbb{E}_{R\sim Bernoulli(p)}\left[\| y\ -...

regression dropout

9

Warum ein Gaußsches Mischungsmodell verwenden?

Ich lerne etwas über Gaußsche Mischungsmodelle (GMM), bin aber verwirrt darüber, warum jemand diesen Algorithmus jemals verwenden sollte. Wie ist dieser Algorithmus besser als andere Standard-Clustering-Algorithmen wie Mittel, wenn es um Clustering geht? Der bedeutet, dass der Algorithmus Daten in...

normal-distribution unsupervised-learning gaussian-mixture

9

So reduzieren Sie Prädiktoren auf die richtige Weise für ein logistisches Regressionsmodell

Daher habe ich einige Bücher (oder Teile davon) über Modellierung gelesen (unter anderem F. Harrells "Regressionsmodellierungsstrategien"), da ich derzeit ein logistisches Modell erstellen muss, das auf binären Antwortdaten basiert. Ich habe sowohl kontinuierliche, kategoriale als auch binäre Daten...

logistic predictive-models feature-selection regression-strategies