Statistiken und Big Data

8

Warum überschätzt Q-Learning die Aktionswerte?

Ich habe Schwierigkeiten, eine Erklärung dafür zu finden, warum Standard-Q-Learning dazu neigt, Q-Werte zu überschätzen (was durch die Verwendung von doppeltem Q-Learning behoben wird). Die einzigen Quellen, die ich gefunden habe, erklären nicht genau, warum diese Überschätzung auftritt. Zum...

machine-learning reinforcement-learning

8

Paneldaten: Gepoolte OLS vs. RE vs. FE-Effekte

Wir hatten einige Diskussionen über die Nützlichkeit von Pooled-OLS- und RE-Schätzern im Vergleich zu FE. Soweit ich das beurteilen kann, handelt es sich bei der Pooled OLS-Schätzung lediglich um eine OLS-Technik, die mit Panel-Daten ausgeführt wird. Daher werden alle individuell spezifischen...

panel-data random-effects-model fixed-effects-model pooling

8

In welchem Verhältnis steht die Zielfunktion der negativen Stichprobe (NS) zur ursprünglichen Zielfunktion in word2vec?

Ich habe das Standard- / berühmte word2vec- Modell gelesen und gemäß den Standardnotizen für cs224n ändert sich die Zielfunktion von: J.o r i gi n a l= -∑j = 0 , j ≠ m2 mu⊤c - m + jvc+ 2 m l o g(∑k = 1| V.|e x p (u⊤kvc) )J.ÖrichGichneinl=- -∑j=0,j≠m2muc-

neural-networks deep-learning natural-language word2vec word-embeddings

8

Ist es möglich, eine logistische Regression ohne Zufälligkeit zu simulieren?

Wir können eine lineare Regression ohne Zufälligkeit simulieren, was bedeutet, dass wir y=Xβy=Xβy=X\beta anstelle von y=Xβ+ϵy=Xβ+ϵy=X\beta+\epsilon . Wenn wir dann ein lineares Modell anpassen, sind die Koeffizienten identisch mit der "Grundwahrheit". Hier ist ein Beispiel. set.seed(0) n <-...

r logistic regularization linear separation

8

Verletzung der Normalität der Restannahme im linearen gemischten Modell

Ich habe eine Frage, wie besorgt ich über einen möglichen Verstoß gegen die Normalität der Residuenannahme in einem linearen gemischten Modell sein sollte. Ich habe einen relativ kleinen Datensatz und nach dem Anpassen des Modells (unter Verwendung von 'lmer' in R) zeigt ein Shapiro-Wilks-Test eine...

mixed-model lme4-nlme

8

Wo sind die Residuen in einem GLM?

Ich gehe gerade zu GLMs nach den Standardmodellen über. Im Standardmodell y = Xb + epsilon und es wird angenommen, dass epsilon normal verteilt ist. Das heißt, wir können schreiben y - Xb = epsilon und dann können wir die lhs unter Verwendung einer geeigneten Norm unter der Annahme der Normalität...

generalized-linear-model residuals

8

PCA ist zu CCA wie ICA zu?

PCA sucht nach Faktoren in Daten, die die erklärte Varianz maximieren. Die kanonische Korrelationsanalyse (CCA) ähnelt meines Wissens einer PCA, sucht jedoch nach Faktoren, die die Kreuzkovarianz zwischen zwei Datensätzen maximieren. Finden Sie also pca-ähnliche Faktoren, die zwei Datensätzen...

pca canonical-correlation ica

8

Wie berechnet man das Konfidenzintervall für ein geometrisches Mittel?

Entschuldigung, wenn dies überhaupt verwirrend ist, bin ich mit geometrischen Mitteln sehr unbekannt. Für den Kontext beträgt mein Datensatz 35 Portfoliowerte zum Monatsende. Ich habe die Wachstumsrate von Monat zu Monat [Monat (N) / Monat (N-1)] - 1 ermittelt, sodass ich jetzt 34 Beobachtungen...

distributions confidence-interval geometric-mean

8

Unterschied zwischen Naive Bayes und Recurrent Neural Network (LSTM)

Ich möchte eine Stimmungsanalyse für Text durchführen, habe mehrere Artikel durchgesehen, einige verwenden "Naive Bayes" und andere sind "Recurrent Neural Network (LSTM)" , andererseits habe ich eine Python-Bibliothek für die Stimmungsanalyse gesehen, die ist nltk. Es verwendet "Naive Bayes". Kann...

machine-learning neural-networks python natural-language

8

So erstellen Sie eine Markov-Kette mit einer Gamma-Randverteilung und einem AR (1) -Koeffizienten von

Ich möchte eine synthetische Zeitreihe generieren. Die Zeitreihe muss eine Markov-Kette mit einer Gamma-Randverteilung und einem AR (1) -Parameter von . Kann ich dies tun, indem ich einfach eine Gammaverteilung als Rauschbegriff in einem AR (1) -Modell verwende, oder muss ich einen...

time-series markov-process gamma-distribution autoregressive

8

Lineare Regression + Confounder

Angenommen, ich würde gerne auf die Effektgröße und Signifikanz zwischen Ergebnis Y und Variable X zugreifen, die durch den Confounder Z angepasst wurden . Meine Frage ist, ob es einen Unterschied gibt, um die Effektgröße und Signifikanz von X zwischen dem folgenden Szenario zu bestimmen . Setzen...

regression

8

Nullsummeneigenschaft der Differenz zwischen den Daten und dem Mittelwert

Ich bin neu in statistischen Studien und auf dieser Website und bin in meinem Buch auf die "Nullsummen-Eigenschaft" bezüglich des Mittelwerts gestoßen. Es scheint einfach zu sein, aber ich kann den Begriff immer noch nicht verstehen. Die einzige Information, die es mit der Formel gibt, ist Die...

mean

8

Interpretation parametrischer und nicht parametrischer Tests

Ich habe Fragen zu parametrischen und nicht parametrischen Testunterscheidungen durchsucht, und es scheint, dass sich alle Fragen auf einen sehr spezifischen Test, ein Datenproblem oder eine technische Unterscheidung konzentrieren. Ich bin nicht an der Frage des Testens von Annahmen (nicht;...

hypothesis-testing nonparametric interpretation parametric

8

Warum werden Typ-II-Fehler beim Testen von Hypothesen als Fehler angesehen?

Ich lese über Entscheidungsfehler beim Testen von Hypothesen. Meine Frage ist, warum ein "Typ-II-Fehler" überhaupt als Fehler angesehen wird. Soweit ich weiß, entsteht dies, wenn wir eine falsche Nullhypothese nicht ablehnen. Wenn wir die Nullhypothese nicht ablehnen, bedeutet dies einfach, dass...

hypothesis-testing statistical-significance p-value

8

Ist der Shapiro Wilk Test W eine Effektgröße?

Ich möchte vermeiden, Normalitätstests zu missbrauchen, bei denen eine ausreichend große Stichprobe eine leichte Nichtnormalität hervorhebt. Ich möchte sagen können, dass eine Verteilung "normal genug" ist. Wenn die Population nicht normal ist, tendiert der p-Wert für den Shapiro-Wilk-Test mit...

hypothesis-testing normality-assumption effect-size

8

Anzeichen verwandter Kovarianzen

Angenommen, und Y sind zwei positive RVs und C o v ( X , Y ) > 0 . Bedeutet dies, dass C o v ( X , 1 / Y ) < 0 ist , oder werden weitere Informationen

covariance

8

Feature, das durch maximales Pooling im Vergleich zum mittleren Pooling extrahiert wurde

Ist es beim Deep Learning und seiner Anwendung auf Computer Vision möglich zu erkennen, welche Funktionen diese beiden Arten von Pooling-Extrakten bieten? Kann man beispielsweise sagen, dass der maximale Pool Kanten extrahiert? Können wir etwas Ähnliches in Bezug auf Mean Pooling sagen? PS Sie...

machine-learning deep-learning feature-construction computer-vision

8

Warum wird sqrt (6) verwendet, um epsilon für die zufällige Initialisierung neuronaler Netze zu berechnen?

In den Vorlesungsunterlagen der 5. Woche für Andrew Ngs Coursera Machine Learning Class wird die folgende Formel zur Berechnung des Werts von der zum Initialisieren von mit zufälligen Werten verwendet wird:ϵϵ\epsilonΘΘ\Theta In der Übung werden weitere Erläuterungen gegeben: Eine effektive...

machine-learning neural-networks random-generation

8

Kolmogorov Smirnov Z gegen Mann Whitney U kleine Stichprobengröße n = 15?

Ich habe eine kleine Stichprobengröße von 15. Ich möchte sehen, ob es einen Unterschied in der Nährstoffaufnahme zwischen zwei unabhängigen Variablen gibt, Gruppe 1 n = 11, Gruppe 2 n = 4. Die Daten sind nicht normal verteilt. Welcher Test ist besser geeignet, der Mann Whitney U- oder der...

mean wilcoxon-mann-whitney small-sample median kolmogorov-smirnov

8

Laien Statistik Talk

Was sagt die Statistik über diesen Laien hin und her: Laie A: Die Tatsache, dass John genau in diesem Moment sein Glas Wein auf den Tisch verschüttet hat, ist eigenartig. Ich habe noch nie einen Mann gesehen, der sein Glas so gut beherrscht. Laie B: Nun, statistisch gesehen ist es Zeit, dass er...

uncertainty