Statistiken und Big Data

10
REML vs ML stepAIC

Ich fühle mich überwältigt, nachdem ich versucht habe, mich mit der Literatur zu befassen, wie ich meine gemischte Modellanalyse durchführen kann, um anschließend mit AIC das beste Modell oder die besten Modelle auszuwählen. Ich denke nicht, dass meine Daten so kompliziert sind, aber ich suche nach...

10
Was ist punktuelle Varianz?

Beim Lesen der Elemente des statistischen Lernens bin ich mehrmals auf den Begriff "punktuelle Varianz" gestoßen. Obwohl ich eine vage Vorstellung davon habe, was es wahrscheinlich bedeutet, wäre ich dankbar zu wissen Wie ist es definiert? Wie wird es abgeleitet?

10
Kann ich Bootstrapping verwenden, warum oder warum nicht?

Ich arbeite derzeit an Schätzungen der Biomasse mithilfe von Satellitenbildern. Ich werde schnell den Hintergrund meiner Frage definieren und dann die statistische Frage erklären, an der ich arbeite. Hintergrund Problem Ich versuche, die Biomasse in einem Gebiet in Frankreich abzuschätzen....

10
R und EViews Unterschiede in AR (1) Schätzungen

Das Hauptproblem ist: Ich kann nicht ähnliche Parameterschätzungen mit EViews und R. erhalten Aus Gründen, die ich selbst nicht kenne, muss ich Parameter für bestimmte Daten mithilfe von EViews schätzen. Dies erfolgt durch Auswahl der Option NLS (nichtlineare kleinste Quadrate) und Verwendung der...

10
einfache Stichprobenmethode für einen Kernel Density Estimator

Ich habe einen einfachen Kernel Density Estimator in Java entwickelt, der auf ein paar Dutzend Punkten (vielleicht bis zu einhundert oder so) und einer Gaußschen Kernelfunktion basiert. Die Implementierung gibt mir zu jedem Zeitpunkt das PDF und CDF meiner Wahrscheinlichkeitsverteilung. Ich möchte...

10
Gilt der multivariate zentrale Grenzwertsatz (CLT), wenn Variablen eine perfekte zeitgleiche Abhängigkeit aufweisen?

Xi∽iidN(0,1)Xi∽iidN(0,1)X_i \overset{iid}{\backsim} \mathcal{N}(0, 1)i=1,...,ni=1,...,ni = 1, ..., nSn=1n∑i=1nXiSn=1n∑i=1nXi\begin{equation} S_n = \frac{1}{n} \sum_{i=1}^n X_i \end{equation}Tn=1n∑i=1n(X2i−1)Tn=1n∑i=1n(Xi2−1)\begin{equation} T_n = \frac{1}{n} \sum_{i=1}^n (X_i^2 - 1) \end{equation}...

10
Auswahl der Anzahl der beizubehaltenden Hauptkomponenten

Eine Methode, die mir vorgeschlagen wurde, besteht darin, sich ein Geröllplot anzusehen und nach "Ellbogen" zu suchen, um die richtige Anzahl der zu verwendenden PCs zu bestimmen. Aber wenn die Darstellung nicht klar ist, hat R eine Berechnung, um die Anzahl zu bestimmen? fit <- princomp(mydata,...

10
Long-Tailed-Verteilung von Zeitereignissen

Angenommen, Sie haben die Protokolle eines Webservers. In diesen Protokollen haben Sie Tupel dieser Art: user1, timestamp1 user1, timestamp2 user1, timestamp3 user2, timestamp4 user1, timestamp5 ... Diese Zeitstempel repräsentieren zB die Klicks der Benutzer. user1Besuchen Sie die Site jetzt...