Statistiken und Big Data

10

Vorhersage der Reaktion neuer Kurven mit dem FDA-Paket in R.

Grundsätzlich möchte ich nur anhand einiger Kurven eine skalare Reaktion vorhersagen. Ich bin so weit gekommen, eine Regression durchzuführen (mit fRegress aus dem FDA-Paket), habe aber keine Ahnung, wie ich die Ergebnisse auf einen NEUEN Satz von Kurven anwenden soll (zur Vorhersage). Ich habe N =...

r functional-data-analysis

10

Wie vergleiche ich zwei instationäre Zeitreihen, um eine Korrelation zu bestimmen?

Ich habe zwei Datenreihen, die das mittlere Alter beim Tod im Laufe der Zeit darstellen. Beide Serien zeigen ein erhöhtes Alter beim Tod im Laufe der Zeit, aber eines viel niedriger als das andere. Ich möchte feststellen, ob sich die Zunahme des Todesalters der unteren Stichprobe signifikant von...

time-series correlation stata

10

Einwände gegen die Randomisierung

In klinischen Studien - eine methodologische Perspektive , schreibt Steven Piantadosi (Kap. 13, S. 334): In Kapitel 2 habe ich die Einwände von Abel und Koch (1997) und Urbach (1993) gegen die Randomisierung zur Kenntnis genommen und darauf hingewiesen, dass es sich lohnt, ihre Bedenken und...

clinical-trials random-allocation

10

Erwartete Anzahl unsichtbarer Karten beim Ziehen von Karten aus einem Stapel der Größe

Wir haben ein Kartenspiel mit Karten. Wir ziehen einheitlich zufällig Karten mit Ersatz. Wie viele Karten werden nach Ziehungen nie ausgewählt? 2 nnnn2 n2n2n Diese Frage ist Teil 2 von Problem 2.12 in M. Mitzenmacher und E. Upfal, Wahrscheinlichkeit und Datenverarbeitung : Randomisierte...

probability expected-value

10

So testen Sie formell, ob eine normale (oder eine andere) Verteilung „unterbrochen“ ist

In der Sozialwissenschaft kommt es häufig vor, dass Variablen, die beispielsweise normal verteilt werden sollten , eine Diskontinuität in ihrer Verteilung um bestimmte Punkte aufweisen. Wenn es beispielsweise bestimmte Grenzwerte wie "Bestehen / Nichtbestehen" gibt und diese Maßnahmen einer...

normal-distribution pdf

10

LaTeX-Ausgabe für das Objekt summary.lm von R - während die Informationen außerhalb der Tabelle angezeigt werden [geschlossen]

Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Kreuz Validated. Geschlossen vor 3 Jahren . Dies schien mir grundlegend zu sein, aber ich kann online keine Lösung...

r regression

10

Was ist die Nullhypothese im Mann-Whitney-Test?

Sei ein Zufallswert aus Verteilung 1 und sei ein Zufallswert aus Verteilung 2. Ich dachte, dass die Nullhypothese für den Mann-Whitney-Test .X1X1X_1X2X2X_2P(X1<X2)=P(X2<X1)P(X1<X2)=P(X2<X1)P(X_1 < X_2) = P(X_2 < X_1) Wenn ich Simulationen des Mann-Whitney-Tests mit Daten aus...

nonparametric wilcoxon-mann-whitney

10

Zufällige Gesamtstruktur für gruppierte Daten

Ich verwende zufällige Gesamtstruktur für hochdimensionale gruppierte Daten (50 numerische Eingabevariablen), die eine hierachische Struktur haben. Die Daten wurden mit 6 Replikationen an 30 Positionen von 70 verschiedenen Objekten gesammelt, was zu 12600 Datenpunkten führte, die nicht unabhängig...

regression random-forest

10

Warum sollte man in einer genetischen Assoziationsstudie das Quadrat des Alters als Kovariate verwenden?

Warum sollte man in einer genetischen Assoziationsstudie Alter und Altersquadrat als Kovariaten verwenden? Ich kann die Verwendung des Alters verstehen, wenn es als signifikante Kovariate identifiziert wurde, aber ich bin hinsichtlich der Verwendung des Alters im Quadrat

multiple-regression polynomial predictor bioinformatics genetics

10

Baumgröße in Gradientenbaumverstärkung

Die von Friedman vorgeschlagene Erhöhung des Gradientenbaums verwendet Entscheidungsbäume mit JEndknoten (= Blätter) als Basislerner. Es gibt eine Reihe von Möglichkeiten, einen Baum mit genau JKnoten zu züchten, zum Beispiel kann man den Baum in der Tiefe zuerst oder in der Breite zuerst züchten,...

r cart boosting

10

Normalverteilung über einen begrenzten Bereich

Gibt es eine Verteilung, die der Gaußschen (Normal-) Verteilung ähnelt, deren Wahrscheinlichkeitsdichte jedoch nur über ein definiertes Segment ungleich Null ist? Die Frage stellte sich, als ich versuchte, die "Kugelausbreitung" innerhalb eines Kreises zu modellieren. Die Gaußsche Verteilung...

distributions normal-distribution modeling

10

Wie interpretiere ich logarithmisch transformierte Koeffizienten in der linearen Regression?

Meine Situation ist: Ich habe 1 kontinuierliche abhängige und 1 kontinuierliche Prädiktorvariable, die ich logarithmisch transformiert habe, um ihre Residuen für eine einfache lineare Regression zu normalisieren. Ich würde mich über jede Hilfe freuen, wie ich diese transformierten Variablen mit...

regression data-transformation regression-coefficients logarithm

10

Wie kann ich die Phasendifferenz zwischen zwei periodischen Zeitreihen schätzen?

Ich habe 2 tägliche Zeitreihen, alle 6 Jahre lang. Während sie laut sind, sind beide deutlich periodisch (mit einer Häufigkeit von ~ 1 Jahr), scheinen jedoch phasenverschoben zu sein. Ich möchte die Phasendifferenz zwischen diesen Zeitreihen schätzen. Ich habe das Anpassen von Kurven der Form zu...

time-series fourier-transform

10

Fourier-Transformation von Verteilungen

Welche Verteilungen sind neben der Normalverteilung und der verallgemeinerten Arkussinusverteilung ihre eigene Fourier-Transformation

distributions fourier-transform

10

Was ist in R der beste Grafiktreiber für die Verwendung der Grafiken in Microsoft Word?

Ich verwende R, um ordentliche Diagramme zu erstellen, die ich in Microsoft Office-Dokumenten verwende. Laut dieser Seite wird mit dem PDF-Treiber die beste Qualität erzielt. Leider unterstützt Word das Importieren von PDF-Abbildungen nicht. Was soll ich

r data-visualization

10

Erster kurzer Blick auf einen Datensatz

Bitte verzeihen Sie meine Unwissenheit, aber ... Ich befinde mich immer wieder in einer Situation, in der ich mit einer Reihe neuer Daten konfrontiert bin, die ich gefunden habe. Diese Daten sehen normalerweise ungefähr so aus: Date Number1 Number2 Category1 Category2 20120125 11 101 Dog Brown...

data-visualization correlation data-mining eda

10

Gibt es eine Möglichkeit, die Kreuzvalidierung zu verwenden, um eine Variablen- / Merkmalsauswahl in R durchzuführen?

Ich habe einen Datensatz mit ungefähr 70 Variablen, die ich reduzieren möchte. Ich möchte den Lebenslauf verwenden, um die nützlichsten Variablen auf folgende Weise zu finden. 1) Wählen Sie zufällig etwa 20 Variablen aus. 2) Verwenden Sie stepwise/ LASSO/ lars/ etc, um die wichtigsten Variablen...

r cross-validation feature-selection random-forest stepwise-regression

10

Fehlende Werte in der Antwortvariablen in JAGS

Gelman & Hill (2006) sagen: In Bugs können fehlende Ergebnisse in einer Regression einfach behandelt werden, indem einfach der Datenvektor, die NAs und alle eingeschlossen werden. Bugs modellieren die Ergebnisvariable explizit. Daher ist es trivial, dieses Modell zu verwenden, um fehlende...

missing-data bugs jags

10

Erklärung der statistischen Simulation

Ich bin kein Statistiker. Also, bitte ertragen Sie meine Fehler, wenn überhaupt. Würden Sie bitte auf einfache Weise erklären, wie die Simulation durchgeführt wird? Ich weiß, dass es eine zufällige Stichprobe aus einer Normalverteilung auswählt und zur Simulation verwendet. Aber verstehe nicht...

simulation

10

Wie kann ich Korrelationen zwischen Abstürzen und Systemumgebungen finden?

In meiner Freizeit arbeite ich an einem kleinen webbasierten System, das Absturzberichte (aber keine anderen, nicht abstürzenden Fehlerberichte) sammelt, die von Delphi Windows-Anwendungen gesendet werden. Zur Fehlerbehebung hätten Benutzer gerne eine Data-Mining-Funktion, um Beziehungen zwischen...

data-mining