Statistiken und Big Data

11

Abweichung im Durchschnittsalter für die Titelqualifikation des Großmeisters nach Altersgruppen?

Es ist seit geraumer Zeit bekannt, dass das jüngste Alter, in dem sich Schachspieler für den Großmeistertitel qualifizieren konnten, seit den 1950er-Jahren erheblich zurückgegangen ist. Derzeit sind fast 30 Spieler vor ihrem 15. Geburtstag Großmeister geworden . Auf Chess Stack Exchange gibt es...

11

Wie ist

Angenommen, YYY ist eine kontinuierliche Zufallsvariable und XXX ist eine diskrete. Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y)Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y) \Pr(X=x|Y=y) = \frac{\Pr(X=x)\Pr(Y=y|X=x)}{\Pr(Y=y)} Wie wir wissen, ist Pr(Y=y)=0Pr(Y=y)=0\Pr(Y=y) = 0 weil YYY eine kontinuierliche...

conditional-probability pdf

11

Logistische Regression für Daten aus Poisson-Verteilungen

Aus einigen Notizen zum maschinellen Lernen, die über diskriminierende Klassifizierungsmethoden sprechen, insbesondere die logistische Regression, wobei y die Klassenbezeichnung (0 oder 1) und x die Daten sind, heißt es: Wenn und , ist logistisch.x | y= 0 ~ P o i s s o n (

logistic poisson-distribution statistical-learning

11

Gegenbeispiele, bei denen der Median außerhalb von [Mode-Mean] liegt

Dieser Artikel steht über meiner Liga, aber er spricht über ein Thema, das mich interessiert, die Beziehung zwischen Mittelwert, Modus und Median. Es sagt : Es wird allgemein angenommen, dass der Median einer unimodalen Verteilung "normalerweise" zwischen dem Mittelwert und dem Modus liegt. Dies...

mean median mode

11

Ein umgekehrtes Geburtstagsproblem: Kein Paar von 1 Million Außerirdischen hat Geburtstag. Was ist ihre Jahreslänge?

Nehmen Sie einen Planeten mit einem sehr sehr langen Jahr von Tagen an. Es gibt 1 Million Aliens auf einer Party in einem Raum und niemand hat Geburtstag. Was kann über die Größe von N abgeleitet werden ?NNNNNN (Diese kompaktere Frage ersetzt diese schlecht formulierte.

probability birthday-paradox

11

Was passiert mit dem Wahrscheinlichkeitsverhältnis, wenn immer mehr Daten gesammelt werden?

Lassen Sie , g und h Dichten und nehme an, Sie haben x i ~ h , i ∈ N . Was passiert mit dem Wahrscheinlichkeitsverhältnis n ∏ i = 1 f ( x i )fffggghhhxi∼hxi∼hx_i \sim hi∈Ni∈Ni \in \mathbb{N} alsn→∞? (Konvergiert es? Zu was?)∏i=1nf(xi)g(xi)∏i=1nf(xi)g(xi) \prod_{i=1}^n \frac{f(x_i)}{g(x_i)} n→∞n→∞n...

convergence asymptotics likelihood-ratio

11

Sollte ich Random Forest Regressor oder Klassifikator wählen?

Ich passe einen Datensatz mit einer binären Zielklasse durch die zufällige Gesamtstruktur an. In Python kann ich das entweder mit dem randomforestclassifier oder dem randomforestregressor machen. Ich kann die Klassifizierung direkt vom randomforestclassifier erhalten oder ich könnte zuerst...

python random-forest

11

Überwachtes Lernen mit unsicheren Daten?

machine-learning supervised-learning

11

Grundlegende Referenzen zu MCMC für die Bayes'sche Statistik

Ich suche einige Artikel oder Bücher mit praktischen und theoretischen Beispielen über grundlegende MCMC für Bayesian Statistics (With R). Ich habe noch nie etwas über Simulation gelernt und suche deshalb nach "grundlegenden" Informationen. Können Sie mir einige Empfehlungen oder Ratschläge...

bayesian references mcmc

11

Wenn die Schrumpfung auf clevere Weise angewendet wird, funktioniert sie für effizientere Schätzer immer besser?

Angenommen , ich habe zwei Schätzern ß 1 und β 2 , die konsistente Schätzer des gleichen Parameters β 0 und so , dass √βˆ1β^1\widehat{\beta}_1βˆ2β^2\widehat{\beta}_2β0β0\beta_0n−−√(βˆ1−β0)→dN(0,V1),n−−√(βˆ2−β0)→dN(0,V2)n(β^1−β0)→dN(0,V1),n(β^2−β0)→dN(0,V2)\sqrt{n}(\widehat{\beta}_1 -\beta_0)...

regression ridge-regression shrinkage penalized

11

Können einseitige Konfidenzintervalle eine Abdeckung von 95% haben?

Ich habe mich gefragt , ob wir angesichts einer einseitigen (einseitigen) Hypothese mit einem Alpha-Level von 95% -Konfidenzintervallen.05 sprechen können . Können wir zum Beispiel getrennte "einseitige" und "zweiseitige" Konfidenzintervalle für einen einseitigen Z- oder t-Test konstruieren ? Was...

hypothesis-testing confidence-interval

11

Wenn Sie es nicht orthogonal machen können, machen Sie es roh (Polynomregression)

Bei der Durchführung einer Polynomregression für YYY auf XXX Menschen manchmal rohe Polynome, manchmal orthogonale Polynome. Aber wenn sie verwenden, was völlig willkürlich erscheint. Hier und hier werden rohe Polynome verwendet. Aber hier und hier scheinen orthogonale Polynome die richtigen...

regression polynomial

11

Generalisierungsgrenzen für SVM

Ich interessiere mich für theoretische Ergebnisse für die Verallgemeinerungsfähigkeit von Support Vector Machines, z. B. Grenzen der Wahrscheinlichkeit von Klassifizierungsfehlern und der Vapnik-Chervonenkis (VC) -Dimension dieser Maschinen. Beim Lesen der Literatur hatte ich jedoch den Eindruck,...

machine-learning svm vc-dimension

11

Zustandsraumdarstellung von ARMA (p, q) aus Hamilton

r=max(p,q+1)r=max(p,q+1)r = \max(p,q+1)yt- μ= ϕ1( yt - 1- μ ) + ϕ2( yt - 2- μ ) + . . . +ϕ3( yt - 3- μ )+ϵt+θ1ϵt−1+...+θr−1ϵt−r+1.yt−μ=ϕ1(yt−1−μ)+ϕ2(yt−2−μ)+...+ϕ3(yt−3−μ)+ϵt+θ1ϵt−1+...+θr−1ϵt−r+1. \begin{aligned} y_t -\mu &= \phi_1(y_{t-1} -\mu) + \phi_2(y_{t-2} -\mu) + ... + \phi_3(y_{t-3} -\mu)...

time-series arima kalman-filter state-space-models

11

Bessere Leistung mit Random Forest One-Vs-All als mit Random Forest Multiclass?

Ich arbeite an einem Mehrklassenproblem mit 9 möglichen Beschriftungen, für die ich einen Datensatz habe, der aus ~ 50.000 Beispielen und ~ 200 Merkmalen besteht. Jedes Beispiel kann nur zu einer Klasse gehören. Die Daten sind zwischen den verschiedenen Bezeichnungen ziemlich ausgewogen. Aufgrund...

random-forest scikit-learn multi-class

11

Variationsinferenz in einfachem Englisch

Nachdem ich Videos auf Youtube gesehen habe, habe ich das Gefühl, dass ich nicht wirklich definieren kann, was Variationsinferenz ist. Ich kann die Verfahren befolgen, während ich mir die Videovorträge darüber ansehe. Aber schwer zu definieren, was wirklich ist. Ich hoffe, davon zu...

machine-learning mathematical-statistics data-mining

11

Lesen von Box-and-Whisker-Plots: Möglich, signifikante Unterschiede zwischen Gruppen festzustellen?

Angenommen, wir sehen uns diese Box-and-Whisker-Handlung an: Ich denke, zwischen Donnerstag und Freitag sind sich die meisten einig, dass es einen signifikanten Unterschied in der Schlafenszeit zu geben scheint. Ist das aber eine statistisch gültige Vermutung? Können wir signifikante Unterschiede...

anova data-visualization boxplot

11

RMSE vs Standardabweichung in der Bevölkerung

RMSE (Root Mean Square Error) und SD (Standardabweichung) haben ähnliche Formeln. Dieser Link sagt Der einzige Unterschied besteht darin, dass Sie durch und nicht durch dividieren, da Sie hier den Stichprobenmittelwert nicht subtrahieren. Der RMSE würde dann \ sigma entsprechen . Daher ist der...

standard-deviation rms

11

Können wir die Null in Nicht-Minderwertigkeitstests akzeptieren?

Bei einem üblichen t-Test der Mittelwerte unter Verwendung der üblichen Hypothesentestmethoden lehnen wir entweder die Null ab oder lehnen die Null nicht ab, akzeptieren jedoch niemals die Null. Ein Grund dafür ist, dass, wenn wir mehr Beweise erhalten würden, dieselbe Effektgröße signifikant...

hypothesis-testing tost non-inferiority

11

Was ist der Unterschied zwischen kleinsten Quadraten und pseudoinversen Techniken für die lineare Regression?

Ich wundere mich über den Unterschied zwischen ihnen. Grundsätzlich erledigen sie am Ende die gleiche Aufgabe, indem sie Parameterkoeffizienten finden, aber sie sehen genauso anders aus, wie wir die Koeffizienten finden. Für mich scheint die Methode der kleinsten Quadrate Differenzierung und...

regression multiple-regression least-squares regression-coefficients