Statistiken und Big Data

9

Was ist der Operator in der Kettenregel, wenn der Gradient eines einschichtigen neuronalen Netzwerks anhand seiner Eingaben abgeleitet wird?

Das Problem ist: Leiten Sie den Gradienten in Bezug auf die Eingabeschicht für ein einzelnes neuronales Netzwerk mit versteckter Schicht ab, indem Sie Sigmoid für Eingabe -> versteckt, Softmax für versteckt -> Ausgabe mit einem Kreuzentropieverlust verwenden. Ich kann den größten Teil...

neural-networks gradient

9

Was ist der Unterschied zwischen Sensitivitätsanalyse und Modellvalidierung?

Ich habe beide Wikipedia-Seiten zur Sensitivitätsanalyse und Modellvalidierung gelesen (hier nur lineare Regressionsvalidierung), aber es gelingt mir nicht, diese beiden Begriffe zu trennen. Ich habe den Eindruck, dass der erste eher in der Wissenschaft und im Ingenieurwesen im Allgemeinen und der...

validation sensitivity-analysis

9

Neuere Beobachtungen in der Regression stärker gewichten

Wie ordne ich neueren Beobachtungen in R mehr Gewicht zu? Ich nehme dies als häufig gestellte Frage oder Wunsch an, aber es fällt mir schwer, genau herauszufinden, wie ich dies umsetzen soll. Ich habe versucht, viel danach zu suchen, aber ich kann kein gutes praktisches Beispiel finden. In meinem...

r time-series regression random-forest

9

Warum werden Informationskriterien (nicht angepasstes

In Zeitreihenmodellen wie ARMA-GARCH werden zur Auswahl einer geeigneten Verzögerung oder Reihenfolge des Modells verschiedene Informationskriterien wie AIC, BIC, SIC usw. verwendet. Meine Frage ist sehr einfach: Warum verwenden wir nicht angepasstes , um ein geeignetes Modell auszuwählen? Wir...

regression time-series model-selection aic bic

9

Beispiele aus der Praxis eines ineffizienten Zufallszahlengenerators

Wir alle wissen, dass Zufallszahlengeneratoren in Computern keine echten Zufallszahlen erzeugen, sondern Pseudozufallszahlen. Außerdem sind einige RNGs besser als andere, und einige sind besser implementiert als andere. Was sind einige Beispiele dafür, wann ein schlechtes RNG verwendet oder ein...

random-generation history

9

Algebraische Klassifikatoren, weitere Informationen?

Ich habe algebraische Klassifikatoren gelesen : einen generischen Ansatz für schnelle Kreuzvalidierung, Online-Training und paralleles Training und war von der Leistung der abgeleiteten Algorithmen begeistert. Es scheint jedoch, dass es jenseits von Naive Bayes (und GBMs) nicht viele Algorithmen...

cross-validation references random-forest computational-statistics naive-bayes

9

Unterschied zwischen zentriertem und nicht zentriertem ?

Als mein Professor über Anpassungsgütemaßnahmen sprach, erwähnte er sowohl zentriertes als auch nicht zentriertes R2R2R^2 aber ich bin nicht sicher, ob ich den Unterschied zwischen ihnen hinsichtlich ihrer praktischen Anwendung verstanden habe. In Formeln definierte er

regression goodness-of-fit

9

Modellbau: Wie baue ich ein aussagekräftiges Spielmodell? (verallgemeinertes additives Modell)

Ich habe gesehen, dass es verschiedene Fragen bezüglich der Interpretation und Konstruktion von Gams gibt, was die Schwierigkeit für Nicht-Statistiker zu veranschaulichen scheint, mit diesen umzugehen. Leider konnte ich aus keinem der von mir gelesenen Threads oder Tutorials ein klares Verständnis...

r model-selection gam

9

Einbeziehung der Wahrscheinlichkeitsverteilung früherer Klassen in die logistische Regression

Ich bin erstaunt, dass ich keine Artikel / Vorträge darüber finden kann, wie man Prior Class Probability Distributions in Klassifikatoren wie Logistic Regression oder Random Forest integrieren kann. Meine Frage lautet also: Wie kann die Wahrscheinlichkeitsverteilung früherer Klassen in...

logistic bayesian random-forest prior

9

Beispiele aus dem wirklichen Leben für den Unterschied zwischen Unabhängigkeit und Korrelation

Es ist bekannt, dass die Unabhängigkeit von Zufallsvariablen eine Nullkorrelation impliziert, eine Nullkorrelation jedoch keine Unabhängigkeit implizieren muss. Ich bin auf viele mathematische Beispiele gestoßen, die die Abhängigkeit trotz Nullkorrelation demonstrieren. Gibt es Beispiele aus dem...

correlation independence intuition

9

1D-Faltung in neuronalen Netzen

Ich verstehe, wie Faltung funktioniert, aber ich verstehe nicht, wie 1D-Faltungen auf 2D-Daten angewendet werden. In diesem Beispiel sehen Sie eine 2D-Faltung in 2D-Daten. Aber wie wäre es, wenn es eine 1D-Faltung wäre? Nur ein 1D-Kernel, der auf die gleiche Weise gleitet? Und wenn der Schritt 2...

conv-neural-network

9

Vorhersage des Vertrauens eines neuronalen Netzwerks

Angenommen, ich möchte ein tiefes neuronales Netzwerk trainieren, um eine Klassifizierung oder Regression durchzuführen, aber ich möchte wissen, wie sicher die Vorhersage sein wird. Wie könnte ich das erreichen? Meine Idee ist es, die Kreuzentropie für jedes Trainingsdatum basierend auf seiner...

machine-learning neural-networks

9

Auswahl des Zeitreihenmodells: AIC vs. SSE außerhalb der Stichprobe und ihre Äquivalenz

AIC wird häufig als Kriterium für den Vergleich von Modellen für die Vorhersage von Zeitreihen empfohlen. Sehen Sie dies zum Beispiel im Kontext dynamischer Regressionsmodelle : Der AIC kann für das endgültige Modell berechnet werden, und dieser Wert kann verwendet werden, um die besten Prädiktoren...

time-series cross-validation model-selection arima aic

9

Hilfe bei der Erwartungsmaximierung aus Papier: Wie kann die vorherige Verteilung einbezogen werden?

Die Frage basiert auf dem Artikel mit dem Titel: Bildrekonstruktion in der diffusen optischen Tomographie unter Verwendung des gekoppelten Strahlungstransport-Diffusions-Modells Download-Link Die Autoren wenden EM-Algorithmus sparsity Regularisierung einer unbekannten Vektors die Pixel eines...

self-study bayesian maximum-likelihood expectation-maximization moving-average

9

Wie viele Daten für Deep Learning?

Ich lerne über Deep Learning (insbesondere CNNs) und wie es normalerweise sehr viele Daten erfordert, um eine Überanpassung zu verhindern. Mir wurde jedoch auch gesagt, dass je höher die Kapazität / mehr Parameter eines Modells sind, desto mehr Daten erforderlich sind, um eine Überanpassung zu...

machine-learning neural-networks deep-learning conv-neural-network

9

Wann ist es in Ordnung zu schreiben, dass wir eine Normalverteilung einer empirischen Messung angenommen haben?

In der Lehre angewandter Disziplinen wie der Medizin ist verankert, dass Messungen bio-medizinischer Mengen in der Bevölkerung einer normalen "Glockenkurve" folgen. Eine Google-Suche der Zeichenfolge "Wir haben eine Normalverteilung angenommen" liefert Ergebnisse! Sie klingen wie "angesichts der...

normal-distribution assumptions normality-assumption lognormal

9

Was ist ein gutes modernes Buch / eine gute Ressource für fortgeschrittene Experimente?

Ich suche nach Ressourcen (muss kein einziges Buch sein), die einige der schwierigeren Fälle von experimentellem Design und statistischer Analyse abdecken. Einige der Fälle, die ich behandeln möchte: 1. Fälle, in denen sich Randomisierungseinheiten von Analyseeinheiten unterscheiden Beispiel: Ich...

references experiment-design

9

Vergleich zwischen Bayes-Schätzern

Betrachten Sie den quadratischen Verlust , wobei vorher gegeben ist, wobei . Sei die Wahrscheinlichkeit. Finden Sie den Bayes-Schätzer .L(θ,δ)=(θ−δ)2L(θ,δ)=(θ−δ)2L(\theta,\delta)=(\theta-\delta)^2π(θ)π(θ)\pi(\theta)π(θ)∼U(0,1/2)π(θ)∼U(0,1/2)\pi(\theta)\sim...

self-study bayesian estimation hierarchical-bayesian loss-functions

9

So fügen Sie einen Interaktionsterm in ein zufälliges Waldmodell ein

Ich verwende die Funktion randomForestin Rs randomForestPaket, um eine Regression durchzuführen. Wenn ich jedoch versuche, einen Interaktionsbegriff in die folgenden Codes aufzunehmen: library(MASS) library(randomForest) Boston_f <- within(Boston, factor(rad)) mdl <- randomForest(lstat ~ rad...

r interaction random-forest

9

Was bedeutet es, über ein Zufallsmaß zu integrieren?

Ich schaue mir derzeit eine Arbeit des Dirichlet-Prozess-Zufallseffektmodells an und die Modellspezifikation lautet wie folgt: wobeider Skalierungsparameter unddas Basismaß ist. Später in diesem Artikel wird vorgeschlagen, eine Funktion über das Basismaßz. B. Ist das Basismaß im Dirichlet-Prozess...

bayesian dirichlet-distribution dirichlet-process nonparametric-bayes measure-theory