Statistiken und Big Data

16

Warum unterscheidet sich das „entspannte Lasso“ vom Standard-Lasso?

Wenn wir mit einer Datenmenge , Lasso anwenden und eine Lösung β L erhalten , können wir Lasso erneut auf die Datenmenge ( X S , Y ) anwenden , wobei S die Menge ungleich Null ist Indizes von β L , um eine Lösung zu erhalten , β R L , die so genannte ‚entspannt LASSO‘ Lösung (korrigiert mich wenn...

16

Was wäre ein Beispiel für ein wirklich einfaches Modell mit einer unlösbaren Wahrscheinlichkeit?

Die ungefähre Bayes'sche Berechnung ist eine wirklich coole Technik, um im Grunde jedes stochastische Modell anzupassen, das für Modelle gedacht ist, bei denen die Wahrscheinlichkeit schwer zu bestimmen ist (Sie können beispielsweise aus dem Modell eine Stichprobe ziehen, wenn Sie die Parameter...

bayesian simulation model likelihood abc

16

Anzahl der Merkmalskarten in neuronalen Faltungsnetzen

Beim Erlernen des neuronalen Faltungsnetzwerks habe ich Fragen zu der folgenden Abbildung. 1) C1 in Layer 1 hat 6 Feature-Maps. Bedeutet das, dass es sechs Faltungskerne gibt? Jeder Faltungskernel wird verwendet, um eine Feature-Map auf der Grundlage von Eingaben zu generieren. 2) S1 in Schicht 2...

machine-learning neural-networks deep-learning pattern-recognition conv-neural-network

16

Warum sollte man zufälliges Vertrauen oder glaubwürdige Intervalle verwenden?

Ich habe kürzlich eine Zeitung gelesen, die Zufälligkeit in ihr Vertrauen und ihre glaubwürdigen Intervalle einbezog, und ich habe mich gefragt, ob dies Standard ist (und wenn ja, warum es eine vernünftige Sache ist, dies zu tun). Um die Notation zu setzen, nehmen wir an, dass unsere Daten und wir...

confidence-interval credible-interval

16

Für welche Verteilungen gibt es einen geschlossenen unverzerrten Schätzer für die Standardabweichung?

Für die Normalverteilung gibt es einen unverzerrten Schätzer für die Standardabweichung, gegeben durch: σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2−−−−−−−−−−−−√σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2\hat{\sigma}_\text{unbiased} = \frac{\Gamma(\frac{n-1}{2})}{\Gamma(\frac{n}{2})}...

mathematical-statistics standard-deviation unbiased-estimator

16

Warum enthält eine ausreichende Statistik alle Informationen, die zur Berechnung einer Schätzung des Parameters erforderlich sind?

Ich habe gerade angefangen, Statistik zu studieren, und ich kann nicht intuitiv verstehen, wie ausreichend ist. Genauer gesagt kann ich nicht nachvollziehen, wie die folgenden beiden Absätze gleichwertig sind: Grob gesagt ist eine ausreichende Statistik eine Funktion T (X), deren Wert alle...

sufficient-statistics

16

Post-hoc-Test für Chi-Quadrat-Anpassungstest

Ich führe einen GOF-Test (Chi-Square Goodness of Fit) mit drei Kategorien durch und möchte speziell die Null testen, bei der die Bevölkerungsanteile in jeder Kategorie gleich sind (dh der Anteil beträgt 1/3 in jeder Gruppe): BEOBACHTETE DATEN Gruppe 1 Gruppe 2 Gruppe 3 ...

hypothesis-testing chi-squared goodness-of-fit post-hoc

16

Was ist das "partielle" in partiellen Methoden der kleinsten Quadrate?

Worauf bezieht sich der Begriff "partiell" in der Regression der kleinsten Quadrate (PLSR) oder in der Strukturgleichungsmodellierung der kleinsten Quadrate

multiple-regression least-squares terminology sem partial-least-squares

16

Sind PCA-Komponenten multivariater Gauß-Daten statistisch unabhängig?

Sind PCA-Komponenten (in der Hauptkomponentenanalyse) statistisch unabhängig, wenn unsere Daten multivariat normalverteilt sind? Wenn ja, wie kann dies nachgewiesen werden? Ich frage, weil ich diesen Beitrag gesehen habe , in dem in der oberen Antwort steht: PCA geht nicht von einer expliziten...

pca independence svd

16

tanh vs. sigmoid im neuronalen Netz

Ich entschuldige mich im Voraus für die Tatsache, dass ich immer noch auf dem Laufenden bin. Ich versuche die Vor- und Nachteile der Verwendung von tanh (Karte -1 bis 1) vs. sigmoid (Karte 0 bis 1) für meine Neuronenaktivierungsfunktion zu verstehen. Nach meiner Lektüre klang es wie eine...

neural-networks

16

Jenks Natural Breaks in Python: Wie finde ich die optimale Anzahl von Pausen?

Ich habe diese Python-Implementierung des Jenks Natural Breaks- Algorithmus gefunden und konnte sie auf meinem Windows 7-Computer ausführen. Es ist ziemlich schnell und es findet die Brüche in weniger Zeit, wenn man die Größe meiner Geodaten berücksichtigt. Bevor ich diesen Clustering-Algorithmus...

python clustering optimization

16

ETS () -Funktion, wie vermeide ich Prognosen, die nicht mit historischen Daten übereinstimmen?

Ich arbeite an einem Alogorithmus in R, um eine monatliche Prognoseberechnung zu automatisieren. Ich benutze unter anderem die Funktion ets () aus dem Vorhersagepaket, um die Vorhersage zu berechnen. Es funktioniert sehr gut. Leider ist das Ergebnis, das ich für einige bestimmte Zeitreihen...

r time-series forecasting exponential-smoothing

16

Was genau ist eine Distribution?

Ich weiß sehr wenig über Wahrscheinlichkeit und Statistik und möchte lernen. Ich sehe das Wort "Verteilung", das überall in verschiedenen Zusammenhängen verwendet wird. Beispielsweise hat eine diskrete Zufallsvariable eine "Wahrscheinlichkeitsverteilung". Ich weiß was das ist. Eine stetige...

distributions definition

16

Metropolis-Hastings-Integration - warum funktioniert meine Strategie nicht?

Angenommen, ich habe eine Funktion , die ich integrieren möchte: Natürlich unter der Annahme, dass an den Endpunkten auf Null geht, keine Blowups, nette Funktion. Eine Möglichkeit, mit der ich herumgespielt habe, besteht darin, mit dem Metropolis-Hastings-Algorithmus eine Liste der Stichproben aus...

simulation monte-carlo metropolis-hastings numerical-integration

16

Warum brauchen wir Bootstrapping?

Ich lese gerade Larry Wassermans "All of Statistics" und wundere mich über etwas, das er in dem Kapitel über das Schätzen statistischer Funktionen nichtparametrischer Modelle geschrieben hat. Er schrieb "Manchmal können wir den geschätzten Standardfehler einer statistischen Funktion durch einige...

self-study estimation bootstrap standard-error

16

R-Paket für Weighted Random Forest? Klassewt Option?

Ich versuche, Random Forest zu verwenden, um das Ergebnis eines extrem unausgeglichenen Datensatzes vorherzusagen (die Minderheitsklassenrate beträgt nur etwa 1% oder sogar weniger). Da der herkömmliche Random Forest-Algorithmus die Gesamtfehlerrate minimiert, anstatt den Minderheitsklassen...

r random-forest

16

Gibt es in der statistischen Lerntheorie nicht ein Problem der Überanpassung eines Testsatzes?

Betrachten wir das Problem beim Klassifizieren des MNIST-Datasets. Laut der MNIST-Webseite von Yann LeCun , "Ciresan et al." 0,23% Fehlerrate beim MNIST-Test mit Convolutional Neural Network. Lassen Sie uns bezeichnen MNIST Trainingssatz als , MNIST Testset als , die letzte Hypothese sie erhalten...

machine-learning classification overfitting probability-inequalities

16

Warum sollten die Daten protokolliert werden, bevor eine Hauptkomponentenanalyse durchgeführt wird?

Ich folge hier einem Tutorial: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/ um ein besseres Verständnis von PCA zu erlangen. Das Lernprogramm verwendet das Iris-Dataset und wendet eine Protokolltransformation vor PCA an: Beachten Sie, dass wir im folgenden Code eine...

r pca data-transformation logarithm

16

Missverständnis eines P-Wertes?

Ich habe viel darüber gelesen, wie man einen P-Wert richtig interpretiert, und nach allem, was ich gelesen habe, sagt der p-Wert NICHTS über die Wahrscheinlichkeit aus, dass die Nullhypothese wahr oder falsch ist. Beim Lesen der folgenden Anweisung: Der p - Wert repräsentiert die...

hypothesis-testing p-value

16

Pearson VS Deviance Residuen in der logistischen Regression

Ich weiß, dass standardisierte Pearson-Residuen auf traditionelle probabilistische Weise erhalten werden: rich= yich- πichπich( 1 - πich)--------√ri=yi−πiπi(1−πi) r_i = \frac{y_i-\pi_i}{\sqrt{\pi_i(1-\pi_i)}} und Abweichungsreste werden auf statistischere Weise erhalten (der Beitrag jedes Punktes...

regression logistic generalized-linear-model residuals deviance