Statistiken und Big Data

18
Out-of-Core-Datenanalyseoptionen

Ich benutze SAS seit fast 5 Jahren professionell. Ich habe es auf meinem Laptop installiert und muss häufig Datensätze mit 1.000 bis 2.000 Variablen und Hunderttausenden von Beobachtungen analysieren. Ich habe nach Alternativen zu SAS gesucht, mit denen ich Analysen mit ähnlich großen Datensätzen...

18
, Simulation über Prognosezeitraum

Ich habe Zeitreihendaten und ich habe ein als Modell verwendet, um die Daten . Das ist eine Indikator-Zufallsvariable, die entweder 0 (wenn ich kein seltenes Ereignis sehe) oder 1 (wenn ich das seltene Ereignis sehe) ist. Basierend auf früheren Beobachtungen, die ich für , kann ich ein Modell für...

18
Zeiträume der Statistikgeschichte

Die Geschichte vieler Wissenschaftsbereiche kann in eine kleine Anzahl von Zeitintervallen unterteilt werden, die oft mit einer wichtigen Entdeckung beginnen. Aber ich habe noch nie etwas Ähnliches in der Statistik gesehen. Offensichtlich gibt es einige wichtige Daten, die als Ausgangspunkt einer...

18
Varianz-Kovarianz-Matrix in lmer

Ich weiß, dass einer der Vorteile gemischter Modelle darin besteht, dass sie die Angabe einer Varianz-Kovarianz-Matrix für die Daten ermöglichen (zusammengesetzte Symmetrie, autoregressiv, unstrukturiert usw.). Die lmerFunktion in R ermöglicht jedoch keine einfache Angabe dieser Matrix. Weiß...

18
Umgang mit einer SVM mit kategorialen Attributen

Ich habe einen Raum von 35 Dimensionen (Attribute). Mein analytisches Problem ist eine einfache Klassifizierung. Von 35 Dimensionen sind mehr als 25 kategorial und jedes Attribut akzeptiert mehr als 50 Werttypen. In diesem Szenario funktioniert die Einführung einer Dummy-Variablen auch für mich...

18
Große Uneinigkeit in der Steigungsschätzung, wenn Gruppen in einem gemischten Modell als zufällig oder fest behandelt werden

Ich verstehe, dass wir Modelle mit zufälligen Effekten (oder gemischten Effekten) verwenden, wenn wir glauben, dass einige Modellparameter über einen Gruppierungsfaktor zufällig variieren. Ich möchte ein Modell xanpassen, bei dem die Reaktion über einen Gruppierungsfaktor normalisiert und zentriert...

18
Verwendung von Gewichten in svyglm vs glm

Ich würde gerne wissen, wie sich die Behandlung von Gewichten zwischen svyglmund unterscheidetglm Ich benutze das twangPaket in R, um Neigungsbewertungen zu erstellen, die dann wie folgt als Gewichte verwendet werden (dieser Code stammt aus der