Statistiken und Big Data

16
Aggregation von Ergebnissen aus linearen Modellläufen R

Da die Regressionsmodellierung oft mehr "Kunst" als Wissenschaft ist, teste ich häufig viele Iterationen einer Regressionsstruktur. Wie lassen sich die Informationen aus diesen mehreren Modellläufen auf effiziente Weise zusammenfassen, um das "beste" Modell zu finden? Ein Ansatz, den ich gewählt...

16
Annahmen der Clusteranalyse

Entschuldigung für die rudimentäre Frage, ich bin neu in dieser Form der Analyse und habe ein sehr begrenztes Verständnis der Prinzipien bis jetzt. Ich habe mich nur gefragt, ob viele der parametrischen Annahmen für multivariate / univariate Tests für die Clusteranalyse zutreffen. Viele der...

16
Wie berechnet man Konfidenzintervalle für Cohen's d?

Ich habe Cohens d für Regressionskoeffizienten (aus der t-Statistik), Quotenverhältnisse und Mittelwertdifferenzen berechnet, in der Hoffnung, die Ergebnisse in einer Metaanalyse zusammenzufassen und zu sehen, wie es funktioniert. In Stata scheint es jedoch nicht möglich zu sein, diese Ergebnisse...

16
Bewertung der Zuverlässigkeit eines Fragebogens: Dimensionalität, problematische Elemente und Verwendung von Alpha, Lambda6 oder einem anderen Index?

Ich analysiere die Ergebnisse von Teilnehmern, die an einem Experiment teilgenommen haben. Ich möchte die Zuverlässigkeit meines Fragebogens einschätzen, der sich aus 6 Elementen zusammensetzt, um die Einstellung der Teilnehmer zu einem Produkt einzuschätzen. Ich habe Cronbachs Alpha berechnet,...

16
Was genau bedeutet es, Daten zu bündeln?

Ich dachte, dass "Daten bündeln" einfach das Kombinieren von Daten bedeutet, die zuvor in Kategorien unterteilt waren ... im Wesentlichen, die Kategorien zu ignorieren und den Datensatz zu einem riesigen "Datenpool" zu machen. Ich denke, das ist mehr eine Frage der Terminologie als der Anwendung...