Statistiken und Big Data

37
Zufallszahl-Set.seed (N) in R [duplizieren]

Diese Frage hat hier bereits eine Antwort: Was genau ist ein Startwert in einem Zufallszahlengenerator? 3 Antworten Mir ist klar, dass man set.seed()in R für die Erzeugung von Pseudozufallszahlen verwendet. Mir ist auch klar, dass man mit der gleichen Nummer, wie bei set.seed(123)Versicherungen,...

37
Vergleich von SVM und logistischer Regression

Kann mir bitte jemand eine Vorstellung davon geben, wann ich mich für SVM oder LR entscheiden soll? Ich möchte die Intuition hinter dem Unterschied zwischen den Optimierungskriterien für das Erlernen der Hyperebene der beiden verstehen, wobei die jeweiligen Ziele wie folgt lauten: SVM: Versuchen...

37
Ist es ungewöhnlich, dass die MEAN ARIMA übertrifft?

Ich habe kürzlich eine Reihe von Prognosemethoden (MEAN, RWF, ETS, ARIMA und MLPs) angewendet und festgestellt, dass MEAN überraschend gut abschneidet. (BEDEUTUNG: Alle zukünftigen Vorhersagen werden als gleich dem arithmetischen Mittel der beobachteten Werte vorausgesagt.) BEDEUTUNG übertraf ARIMA...

37
Wann ist t-SNE irreführend?

Zitat eines Autors: Das t-Distributed Stochastic Neighbor Embedding (t-SNE) ist eine ( preisgekrönte ) Technik zur Dimensionsreduktion, die sich besonders für die Visualisierung hochdimensionaler Datensätze eignet. Es klingt ziemlich gut, aber das ist der Autor. Ein weiteres Zitat des Autors...

37
Warum unterscheiden sich meine p-Werte zwischen der logistischen Regressionsausgabe, dem Chi-Quadrat-Test und dem Konfidenzintervall für den OP?

Ich habe eine logistische Regression aufgebaut, bei der die Ergebnisvariable nach der Behandlung geheilt wird ( Curevs. No Cure). Alle Patienten in dieser Studie erhielten eine Behandlung. Ich bin daran interessiert zu sehen, ob Diabetes mit diesem Ergebnis zusammenhängt. In R sieht meine...