Statistiken und Big Data

8

Das ist unabhängig, wenn und wenn

Sei unabhängige Zufallsvariablen.Xi∼Gamma(α,pi),i=1,2,...,n+1Xi∼Gamma(α,pi),i=1,2,...,n+1X_i\sim\text{Gamma}(\alpha,p_i),i=1,2,...,n+1 Definiere und . Zeigen Sie dann, dass unabhängig voneinander verteilt

8

Ableitung von Konfidenz- und Vorhersageintervallen von Vorhersagen für Probit und Logit (und GLMs im Allgemeinen)

Die Ableitung des Vorhersageintervalls für das lineare Modell ist recht einfach: Erhalten einer Formel für Vorhersagegrenzen in einem linearen Modell . Wie lassen sich die Konfidenz- und Vorhersageintervalle für die angepassten Werte der Logit- und Probit-Regressionen (und GLMs im Allgemeinen)...

confidence-interval generalized-linear-model logit prediction-interval probit

8

Wann scheitert Deep Learning?

Deep Learning ist heutzutage ein immer heißer werdendes Thema. Was sind die Hauptannahmen, die dazu führen, dass Deep Learning in einigen Datensätzen fehlt? Beispiel: Funktioniert es bei verrauschten Datensätzen

machine-learning mathematical-statistics deep-learning

8

Die Summe der linearen Kombination des Produkts der Exponentiale ist exponentiell

Dieses Problem ist in meiner Forschung aufgetreten: Nehmen wir an, dass iid Exponentialverteilungen (ED) mit dem Mittelwert 1 sind und λ eine nichtnegative Zahl sei. Stimmt es, dass ∞ ∑ k = 0 λ k e - λ V 0 ⋯ V k ist ?V.ich∼ EDVi∼EDV_i \sim \text{ED}111λλ\lambda Dies besteht die Überprüfung der...

distributions mathematical-statistics poisson-distribution exponential saddlepoint-approximation

8

Wie kann man Lasso interpretieren, das alle Koeffizienten auf 0 verkleinert?

Ich habe einen Datensatz mit 338 Prädiktoren und 570 Instanzen (kann leider nicht hochgeladen werden), auf denen ich das Lasso verwende, um die Funktionsauswahl durchzuführen. Insbesondere verwende ich die cv.glmnetFunktion glmnetwie folgt: Dabei mydata_matrixhandelt es sich um eine 570 x...

r classification lasso glmnet

8

Modell mit zulässigen Schätzern, die nicht der Bayes-Schätzer für eine Auswahl von Prior sind?

Jeder Bayes-Schätzer ist nach meinem besten Wissen zulässig. (Verwandte Fragen - 1 , 2. ) Ich erinnere mich, dass mein Professor einmal während einer Vorlesung erwähnt hat, dass, zumindest als grobe Intuition, auch das Gegenteil der Fall ist, dh jeder zulässige Schätzer ist der Bayes-Schätzer für...

bayesian mathematical-statistics prior example admissibility

8

Warum hat dieser Datensatz keine Kovarianz?

Mein Verständnis der Funktionsweise der Kovarianz ist, dass korrelierte Daten eine etwas hohe Kovarianz aufweisen sollten. Ich bin auf eine Situation gestoßen, in der meine Daten korreliert aussehen (wie im Streudiagramm gezeigt), die Kovarianz jedoch nahe Null liegt. Wie kann die Kovarianz der...

python descriptive-statistics covariance

8

Hamiltonian Monte Carlo (HMC): Was ist die Intuition und Rechtfertigung hinter einer Gaußschen verteilten Impulsvariablen?

Ich lese gerade ein großartiges HMC-Einführungspapier von Prof. Michael Betancourt, aber ich verstehe nicht, wie wir die Verteilung des Impulses wählen sollen. Zusammenfassung Die Grundidee von HMC besteht darin, eine Impulsvariable in Verbindung mit der Zielvariablen einzuführen . Sie bilden...

mcmc monte-carlo hmc

8

Wie wählen Sie die Anzahl der Fächer aus, die für einen Chi-Quadrat-GOF-Test verwendet werden sollen?

Ich arbeite an der Entwicklung eines Physiklabors zum radioaktiven Zerfall. Bei der Analyse der von mir entnommenen Probendaten stieß ich auf ein Statistikproblem, das mich überraschte. Es ist bekannt, dass die Anzahl der Zerfälle pro Zeiteinheit durch eine radioaktive Quelle Poisson-verteilt ist....

chi-squared binning application

8

Was ist die Rechtfertigung für die Verwendung von Taylor-Approximationen innerhalb von Erwartungsoperatoren?

Ich sehe manchmal Leute, die Taylor Approximation wie folgt verwenden: E(ex)≈E(1+x)E(ex)≈E(1+x)E(e^x)\approx E(1+x) Ich weiß, dass die Taylor-Näherung für funktioniert ex≈1+xex≈1+xe^x \approx 1+x Mir ist jedoch nicht klar, dass wir die Annäherung innerhalb des Erwartungsoperators durchführen...

expected-value approximation

8

Merkmalsauswahl auf einem Bayes'schen hierarchischen verallgemeinerten linearen Modell

Ich möchte eine hierarchische GLM schätzen, aber mit Merkmalsauswahl, um zu bestimmen, welche Kovariaten auf Bevölkerungsebene relevant sind, um sie einzubeziehen. Angenommen, ich habe GGG Gruppen mit NNN Beobachtungen und KKK möglichen Kovariaten. Das heißt, ich habe eine Entwurfsmatrix von...

machine-learning bayesian feature-selection hierarchical-bayesian shrinkage

8

Bestraft die L2-Normalisierung der Gratregression das Abfangen? Wenn nicht, wie kann man seine Ableitung lösen?

Ich bin neu bei ML. Ich wurde informiert, dass die L2-Normalisierung der Gratregression den Achsenabschnitt nicht bestraft . Wie in der Kostenfunktion: Der L2-Normalisierungsterm summiert sich nur von bis , nicht von bis . Ich habe das auch

machine-learning ridge-regression

8

Oberes Vertrauen in maschinelles Lernen gebunden

Ich bin auf die Formel gestoßen, um die oberen Vertrauensgrenzen für das Problem der k-bewaffneten Banditen zu erreichen: c ln N.ichnich- -- -- -- -- -√clnNinic\sqrt{\frac{\text{ln} N_i}{n_i}} Dabei ist die Anzahl der Proben, die wir für diesen bestimmten Banditen haben, und die Gesamtmenge der...

machine-learning mathematical-statistics confidence-interval reinforcement-learning multiarmed-bandit

8

Würden Sie diese Daten als betrügerisch kennzeichnen?

Angenommen, Sie haben einige Daten aus einem randomisierten Blockdesign mit 4 Wiederholungen und 23 Behandlungen erhalten. Nach einer ersten Überprüfung der Daten stellen Sie fest, dass bei 8 Behandlungen alle Wiederholungen identisch sind, was offensichtlich falsch ist. Nachdem Sie das Problem...

probability anova dataset fraud

8

Warum sind PCA-Eigenvektoren orthogonal, aber korreliert?

Ich habe einige großartige Beiträge gesehen, in denen PCA erklärt wurde und warum bei diesem Ansatz die Eigenvektoren einer (symmetrischen) Korrelationsmatrix orthogonal sind. Ich verstehe auch die Möglichkeiten zu zeigen, dass solche Vektoren orthogonal zueinander sind (z. B. führt die Verwendung...

r correlation pca orthogonal

8

Wie kann der AIC oder BIC anstelle des Zug- / Test-Split verwendet werden?

Ich bin kürzlich auf mehrere "informelle" Quellen gestoßen, die darauf hinweisen, dass wir unter bestimmten Umständen, wenn wir den AIC oder BIC zum Trainieren eines Zeitreihenmodells verwenden, die Daten nicht in Test und Training aufteilen müssen - wir können alle verwenden die Daten für das...

time-series cross-validation aic train bic

8

Wenn ich einen Vektor von

Mein letztendliches Ziel ist es, einen Vektor der Größe von korrelierten Bernoulli-Zufallsvariablen erzeugen zu können . Eine Möglichkeit, dies zu tun, besteht darin, den Gaußschen Coupla-Ansatz zu verwenden. Der Gaußsche Coupla-Ansatz lässt mich jedoch nur mit einem Vektor zurück:N.N.N ( p1, … ,...

correlation mathematical-statistics simulation copula

8

Lambda - Exponential vs. Poisson Interpretation

Ich versuche zu verstehen , welche Rolle sowohl in der Poisson- als auch in der Exponentialverteilung spielt und wie sie zum Finden von Wahrscheinlichkeiten verwendet wird (ja, ich habe den anderen Beitrag zu diesem Thema gelesen , habe es nicht ganz für mich getan).λλ\lambda Was ich (glaube ich)...

self-study poisson-distribution exponential-distribution

8

Quantile Transformation mit Gaußscher Verteilung - Sklearn-Implementierung

Dies mag eine vage Frage sein, aber ich frage mich, wie die Quantiltransformation von Scikit-Learn implementiert wird. Ich frage mich, wie ein verzerrter Datensatz in eine solche Normalverteilung umgewandelt werden kann . Normalerweise bietet scikit-learn einen Link zum Wiki, aber nicht diese...

data-transformation quantiles

8

Gilt der universelle Approximationssatz für neuronale Netze für eine Aktivierungsfunktion?

Gilt der universelle Approximationssatz für neuronale Netze für eine Aktivierungsfunktion (Sigmoid, ReLU, Softmax usw.) oder ist er auf Sigmoidfunktionen beschränkt? Update: Wie Shimao in den Kommentaren hervorhebt, gilt es für absolut keine Funktion. Für welche Klasse von Aktivierungsfunktionen...

neural-networks approximation