Statistiken und Big Data

37

Wie finde ich eine gute Passform für ein halbsinusförmiges Modell in R?

Ich möchte annehmen, dass die Meeresoberflächentemperatur der Ostsee Jahr für Jahr gleich ist, und dies dann mit einem Funktions- / Linearmodell beschreiben. Die Idee, die ich hatte, war, einfach das Jahr als Dezimalzahl (oder num_months / 12) einzugeben und herauszufinden, wie hoch die Temperatur...

37

Unterschied zwischen Vorhersage und Vorhersage?

Ich habe mich gefragt, welcher Unterschied und welche Beziehung zwischen Vorhersage und Vorhersage besteht. Besonders in Zeitreihen und Regressionen? Habe ich zum Beispiel Recht, dass: In Zeitreihen scheint Prognose zu bedeuten, zukünftige Werte anhand vergangener Werte einer Zeitreihe zu...

regression time-series forecasting terminology

37

Warum wird Mantels Test Morans vorgezogen?

Mantels Test wird häufig in biologischen Studien verwendet , um die Korrelation zwischen der räumlichen Verteilung von Tieren (Position im Raum) und beispielsweise ihrer genetischen Verwandtschaft, Aggressionsrate oder einem anderen Attribut zu untersuchen. Viele gute Fachzeitschriften verwenden es...

r correlation spatial pattern-recognition

37

Zufallszahl-Set.seed (N) in R [duplizieren]

Diese Frage hat hier bereits eine Antwort: Was genau ist ein Startwert in einem Zufallszahlengenerator? 3 Antworten Mir ist klar, dass man set.seed()in R für die Erzeugung von Pseudozufallszahlen verwendet. Mir ist auch klar, dass man mit der gleichen Nummer, wie bei set.seed(123)Versicherungen,...

r random-generation

37

Hat das Vorzeichen von Punktzahlen oder Ladungen in PCA oder FA eine Bedeutung? Darf ich das Vorzeichen umkehren?

Ich führte eine Hauptkomponentenanalyse (PCA) mit R mit zwei verschiedenen Funktionen ( prcompund princomp) durch und stellte fest, dass sich die PCA-Werte im Vorzeichen unterschieden. Wie kann es sein? Bedenken Sie: set.seed(999) prcomp(data.frame(1:10,rnorm(10)))$x PC1 PC2 [1,] -4.508620...

r pca factor-analysis

37

Hilf mir zu berechnen, wie viele Leute zu meiner Hochzeit kommen werden! Kann ich jeder Person einen Prozentsatz zuweisen und sie hinzufügen?

Ich plane meine Hochzeit. Ich möchte abschätzen, wie viele Personen zu meiner Hochzeit kommen werden. Ich habe eine Liste mit Personen und deren prozentualer Teilnahme erstellt. Beispielsweise Dad 100% Mom 100% Bob 50% Marc 10% Jacob 25% Joseph 30% Ich habe eine Liste von ungefähr 230 Leuten mit...

probability

37

Wie erklärt die Faktoranalyse die Kovarianz, während die PCA die Varianz erklärt?

Hier ist ein Zitat aus Bishops Buch "Mustererkennung und maschinelles Lernen", Abschnitt 12.2.4 "Faktorenanalyse": Gemäß dem markierten Teil, Faktoranalyse erfasst die Kovarianz zwischen den Variablen in der Matrix WWW . Ich frage mich , WIE ? So verstehe ich es. Angenommen, xxx ist die beobachtete...

pca factor-analysis geometry

37

Verbessere die Klassifizierung mit vielen kategorialen Variablen

Ich arbeite an einem Datensatz mit mehr als 200.000 Stichproben und ungefähr 50 Merkmalen pro Stichprobe: 10 kontinuierliche Variablen und die anderen ~ 40 sind kategoriale Variablen (Länder, Sprachen, wissenschaftliche Gebiete usw.). Für diese kategorialen Variablen haben Sie beispielsweise 150...

machine-learning classification categorical-data random-forest many-categories

37

Vergleich von SVM und logistischer Regression

Kann mir bitte jemand eine Vorstellung davon geben, wann ich mich für SVM oder LR entscheiden soll? Ich möchte die Intuition hinter dem Unterschied zwischen den Optimierungskriterien für das Erlernen der Hyperebene der beiden verstehen, wobei die jeweiligen Ziele wie folgt lauten: SVM: Versuchen...

regression logistic svm optimization

37

Warum erreicht glmer nicht die maximale Wahrscheinlichkeit (wie durch weitere generische Optimierung überprüft)?

Numerisch die Ableitung MLE s von GLMM schwierig ist und in der Praxis, ich weiß, wir sollten nicht Brute - Force - Optimierung verwenden (zB mit optimauf einfache Art und Weise). Aus pädagogischen Gründen möchte ich es jedoch versuchen, um sicherzustellen, dass ich das Modell richtig verstehe...

r maximum-likelihood optimization lme4-nlme

37

Prüfen Sie, ob sich zwei Binomialverteilungen statistisch voneinander unterscheiden

Ich habe drei Gruppen von Daten, jede mit einer Binomialverteilung (dh jede Gruppe hat Elemente, die entweder Erfolg oder Misserfolg haben). Ich habe keine vorhergesagte Erfolgswahrscheinlichkeit, sondern kann mich nur auf die Erfolgsrate jedes Einzelnen als Annäherung an die wahre Erfolgsrate...

statistical-significance binomial bernoulli-distribution

37

Ist es ungewöhnlich, dass die MEAN ARIMA übertrifft?

Ich habe kürzlich eine Reihe von Prognosemethoden (MEAN, RWF, ETS, ARIMA und MLPs) angewendet und festgestellt, dass MEAN überraschend gut abschneidet. (BEDEUTUNG: Alle zukünftigen Vorhersagen werden als gleich dem arithmetischen Mittel der beobachteten Werte vorausgesagt.) BEDEUTUNG übertraf ARIMA...

forecasting arima

37

Wann ist t-SNE irreführend?

Zitat eines Autors: Das t-Distributed Stochastic Neighbor Embedding (t-SNE) ist eine ( preisgekrönte ) Technik zur Dimensionsreduktion, die sich besonders für die Visualisierung hochdimensionaler Datensätze eignet. Es klingt ziemlich gut, aber das ist der Autor. Ein weiteres Zitat des Autors...

data-visualization dimensionality-reduction tsne

37

Warum unterscheiden sich meine p-Werte zwischen der logistischen Regressionsausgabe, dem Chi-Quadrat-Test und dem Konfidenzintervall für den OP?

Ich habe eine logistische Regression aufgebaut, bei der die Ergebnisvariable nach der Behandlung geheilt wird ( Curevs. No Cure). Alle Patienten in dieser Studie erhielten eine Behandlung. Ich bin daran interessiert zu sehen, ob Diabetes mit diesem Ergebnis zusammenhängt. In R sieht meine...

r hypothesis-testing logistic generalized-linear-model odds-ratio

37

Vorhersageintervall für lmer () -Mischeffektmodell in R

Ich möchte ein Vorhersageintervall für eine Vorhersage aus einem lmer () -Modell erhalten. Ich habe eine Diskussion darüber gefunden: http://rstudio-pubs-static.s3.amazonaws.com/24365_2803ab8299934e888a60e7b16113f619.html http://glmm.wikidot.com/faq Sie scheinen jedoch die Unsicherheit der...

r mixed-model prediction prediction-interval lme4-nlme

37

Unterschied zwischen "Kernel" und "Filter" in CNN

Was ist der Unterschied zwischen den Begriffen "Kernel" und "Filter" im Kontext von

neural-networks terminology deep-learning conv-neural-network

37

Wird die Tatsache, dass mein italienischer Sohn eine Grundschule besuchen wird, die erwartete Anzahl italienischer Kinder ändern, die in seiner Klasse anwesend sein werden?

Dies ist eine Frage, die aus einer realen Situation stammt, für die ich ernsthaft über ihre Antwort verblüfft bin. Mein Sohn soll in London in die Grundschule gehen. Da wir Italiener sind, war ich gespannt, wie viele italienische Kinder bereits die Schule besuchen. Ich habe dies der...

probability self-study average

37

Was ist der Unterschied zwischen Vorhersage und Inferenz?

Ich lese gerade " Eine Einführung in das statistische Lernen ". In Kapitel 2 diskutieren sie den Grund für die Schätzung einer Funktion .fff 2.1.1 Warum schätzen ?fff Es gibt zwei Hauptgründe, warum wir f abschätzen möchten : Vorhersage und Inferenz . Wir diskutieren nacheinander. Ich habe...

prediction terminology causality

37

Wann sollte eine Variable in eine Regression einbezogen werden, obwohl sie statistisch nicht signifikant ist?

Ich bin ein Wirtschaftsstudent mit etwas Erfahrung in Ökonometrie und R. Ich würde gerne wissen, ob es jemals eine Situation gibt, in der wir eine Variable in eine Regression einbeziehen sollten, obwohl sie statistisch nicht signifikant

statistical-significance feature-selection

37

Varianz der

TL, DR: Es sieht so aus, als ob entgegen häufig wiederholter Ratschläge die einmalige Kreuzvalidierung (LOO-CV) - das heißt, derKKK fache CV mitKKK (die Anzahl der Falten) ist gleichNNN (die Anzahl) der Trainingsbeobachtungen) - liefert Schätzungen des Generalisierungsfehlers, diefür jedes K am...

regression machine-learning variance cross-validation predictive-models