Statistiken und Big Data

11

Wie aktualisiert der Minibatch-Gradientenabstieg die Gewichte für jedes Beispiel in einem Stapel?

Wenn wir beispielsweise 10 Beispiele in einem Stapel verarbeiten, können wir meines Erachtens den Verlust für jedes Beispiel summieren. Wie funktioniert die Rückausbreitung in Bezug auf die Aktualisierung der Gewichte für jedes Beispiel? Beispielsweise: Beispiel 1 -> Verlust = 2 Beispiel 2 ->...

11

Wie man die Ergebnisse interpretiert, wenn sowohl Grat als auch Lasso getrennt gut abschneiden, aber unterschiedliche Koeffizienten erzeugen

Ich führe sowohl mit Lasso als auch mit Ridge ein Regressionsmodell durch (um eine diskrete Ergebnisvariable im Bereich von 0 bis 5 vorherzusagen). Bevor ich das Modell ausführe, verwende ich die SelectKBestMethode scikit-learn, um den Funktionsumfang von 250 auf 25 zu reduzieren . Ohne eine...

regression predictive-models feature-selection lasso ridge-regression

11

Ist Multikollinearität wirklich ein Problem?

Ich arbeite derzeit an einem Vorhersagemodellierungsprojekt: Ich versuche, ein Modell zu lernen und Echtzeitvorhersagen auf der Grundlage des Modells zu treffen, das ich offline gelernt habe. Ich habe kürzlich angefangen, die Ridge-Regression zu verwenden, weil ich gelesen habe, dass...

regression prediction multicollinearity ridge-regression

11

Sollte ich nicht signifikante Ergebnisse melden?

Ich habe einen Kruskal-Wallis-Test durchgeführt, und für einige der Fragen ist der p-Wert nicht signifikant. Würde ich dies auf die gleiche Weise melden, als ob es signifikant wäre, unter Angabe von df, Teststatistik und p-Wert? Es wäre also so etwas wie ein Kruskal-Wallis-Test, aber es wurde...

spss kruskal-wallis reporting

11

Das geometrische Mittel ist ein unvoreingenommener Schätzer für den Mittelwert welcher kontinuierlichen Verteilung?

Gibt es eine kontinuierliche Verteilung, die in geschlossener Form ausgedrückt werden kann und deren Mittelwert so ist, dass der geometrische Mittelwert der Stichproben ein unverzerrter Schätzer für diesen Mittelwert ist? Update: Ich habe gerade festgestellt, dass meine Stichproben positiv sein...

distributions geometric-mean

11

CIFAR-10 Kann nicht mehr als 60% Genauigkeit erreichen, Keras mit Tensorflow-Backend [geschlossen]

Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Kreuz Validated. Geschlossen im vergangenen Jahr . Das Training nach 15...

neural-networks conv-neural-network keras

11

Was ist der Unterschied zwischen deterministischem und stochastischem Modell?

Einfaches lineares Modell: x=αt+ϵtx=αt+ϵtx=\alpha t + \epsilon_t wobei ~ iidϵtϵt\epsilon_tN(0,σ2)N(0,σ2)N(0,\sigma^2) mit undE(x)=αtE(x)=αtE(x) = \alpha tVar(x)=σ2Var(x)=σ2Var(x)=\sigma^2 AR (1): Xt=αXt−1+ϵtXt=αXt−1+ϵtX_t =\alpha X_{t-1} + \epsilon_t wobei ~...

regression stochastic-processes autoregressive deterministic

11

Warum sollte Netflix von seinem Fünf-Sterne-Bewertungssystem zu einem Like / Dislike-System wechseln?

Netflix stützte seine Vorschläge auf die von einem Benutzer eingereichten Bewertungen anderer Filme / Shows. Dieses Bewertungssystem hatte fünf Sterne. Mit Netflix können Benutzer jetzt Filme / Shows mögen / nicht mögen (Daumen hoch / Daumen runter). Sie behaupten, es sei einfacher, Filme zu...

variance predictive-models prediction

11

Bayesianische Spitze und Platte versus bestrafte Methoden

Ich lese Steven Scotts Folien über das BSTS R-Paket (Sie finden sie hier: Folien ). Wenn er über die Einbeziehung vieler Regressoren in das strukturelle Zeitreihenmodell spricht, führt er irgendwann die Spitzen- und Plattenprioren von Regressionskoeffizienten ein und sagt, dass sie im Vergleich zu...

r bayesian feature-selection penalized bsts

11

Wann wird ein Mischeffektmodell verwendet?

Modelle mit linearen gemischten Effekten sind Erweiterungen von linearen Regressionsmodellen für Daten, die in Gruppen gesammelt und zusammengefasst werden. Der Hauptvorteil ist, dass die Koeffizienten in Bezug auf eine oder mehrere Gruppenvariablen variieren können. Ich habe jedoch Probleme damit,...

regression mixed-model random-effects-model linear

11

Pfeile der zugrunde liegenden Variablen im PCA-Biplot in R.

Auf die Gefahr hin, die Frage softwarespezifisch zu machen, und mit der Entschuldigung ihrer Allgegenwart und Eigenheiten möchte ich nach der Funktion biplot()in R und insbesondere nach der Berechnung und Darstellung der entsprechenden, überlagerten Standardpfeile fragen zu den zugrunde liegenden...

r pca biplot

11

Was machst du, wenn deine Freiheitsgrade über das Ende deiner Tische hinausgehen?

Die Freiheitsgrade in meiner F-Tabelle sind für meine große Stichprobe nicht hoch genug. Wenn ich beispielsweise ein F mit 5 und 6744 Freiheitsgraden habe, wie finde ich den kritischen Wert von 5% für eine ANOVA? Was wäre, wenn ich einen Chi-Quadrat-Test mit großen Freiheitsgraden machen würde?...

chi-squared degrees-of-freedom f-distribution tables

11

Vor- und Nachteile von Bootstrapping

Ich habe gerade etwas über das Konzept des Bootstrapens gelernt und eine naive Frage kam mir in den Sinn: Wenn wir immer zahlreiche Bootstrap-Beispiele unserer Daten generieren können, warum sollten wir uns überhaupt die Mühe machen, mehr "echte" Daten zu erhalten? Ich glaube, ich habe eine...

variance bootstrap bias

11

RandomForest- und Klassengewichte

Frage in einem Satz: Weiß jemand, wie man gute Klassengewichte für einen zufälligen Wald bestimmt? Erläuterung: Ich spiele mit unausgeglichenen Datensätzen herum. Ich möchte das RPaket randomForestverwenden, um ein Modell auf einem sehr verzerrten Datensatz mit nur wenigen positiven und vielen...

r random-forest

11

Verstecktes Markov-Modell gegen wiederkehrendes neuronales Netzwerk

Welche sequentiellen Eingabeprobleme eignen sich jeweils am besten? Bestimmt die Eingabedimensionalität, welche besser zu Ihnen passt? Sind Probleme, die "längeren Speicher" erfordern, besser für ein LSTM-RNN geeignet, während Probleme mit zyklischen Eingabemustern (Börse, Wetter) von einem HMM...

time-series neural-networks hidden-markov-model rnn

11

Einfache lineare Regression in Keras

Nachdem ich mir diese Frage angesehen habe: Beim Versuch, die lineare Regression mit Keras zu emulieren , habe ich versucht, mein eigenes Beispiel nur zu Studienzwecken zu erstellen und meine Intuition zu entwickeln. Ich habe einen einfachen Datensatz heruntergeladen und eine Spalte verwendet, um...

regression machine-learning neural-networks linear keras

11

Gegenseitige Information als Wahrscheinlichkeit

Könnte die gegenseitige Information über die Gelenkentropie: 0≤I(X,Y)H(X,Y)≤10≤I(X,Y)H(X,Y)≤1 0 \leq \frac{I(X,Y)}{H(X,Y)} \leq 1 definiert werden als: "Die Wahrscheinlichkeit, eine Information von X nach Y zu übermitteln"? Es tut mir leid, dass ich so naiv bin, aber ich habe noch nie...

information-theory mutual-information

11

Warum hat ein Sackbaum / zufälliger Waldbaum eine höhere Tendenz als ein einzelner Entscheidungsbaum?

Wenn wir einen ausgewachsenen Entscheidungsbaum (dh einen nicht beschnittenen Entscheidungsbaum) betrachten, weist er eine hohe Varianz und eine geringe Verzerrung auf. Bagging und Random Forests verwenden diese Modelle mit hoher Varianz und aggregieren sie, um die Varianz zu verringern und damit...

variance random-forest cart bias bagging

11

Kolmogorov-Smirnov-Test: Die Statistik des p-Werts und des ks-Tests nimmt mit zunehmender Stichprobengröße ab

Warum nehmen p-Werte und ks-Teststatistiken mit zunehmender Stichprobengröße ab? Nehmen Sie diesen Python-Code als Beispiel: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0,...

python p-value goodness-of-fit intuition scipy

11

Ist die Aufteilung der Daten in Test- und Trainingssätze eine reine Statistiksache?

Ich bin ein Physikstudent, der maschinelles Lernen / Datenwissenschaft studiert, daher meine ich nicht, dass diese Frage Konflikte auslöst :) Ein großer Teil eines Physik-Bachelor-Programms besteht jedoch darin, Labore / Experimente durchzuführen, was eine Menge Daten bedeutet Verarbeitung und...

regression machine-learning cross-validation dataset experiment-design