Alle meine Variablen sind stetig. Es gibt keine Levels. Ist es möglich, überhaupt eine Interaktion zwischen den Variablen zu
Alle meine Variablen sind stetig. Es gibt keine Levels. Ist es möglich, überhaupt eine Interaktion zwischen den Variablen zu
Ich verwende AIC (Akaikes Informationskriterium), um nichtlineare Modelle in R zu vergleichen. Ist es gültig, die AICs verschiedener Modelltypen zu vergleichen? Insbesondere vergleiche ich ein von glm angepasstes Modell mit einem von glmer (lme4) angepassten Ausdruck für zufällige Effekte. Wenn...
Wenn Sie ein CART-Modell (insbesondere einen Klassifizierungsbaum) mit rpart (in R) erstellen, ist es häufig interessant zu wissen, welche Bedeutung die verschiedenen Variablen haben, die in das Modell eingeführt werden. Meine Frage lautet daher: Welche gängigen Maße gibt es für das Ranking /...
Die Inter-Market-Analyse ist eine Methode zur Modellierung des Marktverhaltens durch Auffinden von Beziehungen zwischen verschiedenen Märkten. Häufig wird eine Korrelation zwischen zwei Märkten berechnet, z. B. S & P 500 und 30-jährigen US-Treasuries. Diese Berechnungen basieren zumeist auf...
Dies ist eine Frage zur Terminologie. Ist ein "vager Prior" dasselbe wie ein nicht informativer Prior oder gibt es einen Unterschied zwischen den beiden? Mein Eindruck ist, dass sie gleich sind (von vage und nicht informativ zusammen nachschlagen), aber ich kann nicht sicher
Stellen Sie sich einen Jeffreys vor, wo , wo die Fisher-Information ist.ichp ( θ ) ∝ | i ( θ ) |----√p(θ)∝|i(θ)|p(\theta) \propto \sqrt{|i(\theta)|}ichii Ich sehe diesen Prior immer wieder als nicht informativen Prior, aber ich habe nie ein Argument dafür gesehen, warum er nicht informativ ist....
Ich bin neu in R und in der Zeitreihenanalyse. Ich versuche den Trend einer langen (40 Jahre) täglichen Temperatur-Zeitreihe zu finden und versuche verschiedene Annäherungen. Erstens handelt es sich nur um eine einfache lineare Regression und zweitens um die saisonale Zerlegung von Zeitreihen nach...
Was ist der Bedeutungsunterschied zwischen der Notation und P ( z | d , w ), die üblicherweise in vielen Büchern und Veröffentlichungen verwendet werden?P(z;d,w)P(z;d,w)P(z;d,w)P(z|d, W
Ich frage mich, ob es eine einfache Möglichkeit gibt, mit einer for-Schleife eine Liste von Variablen zu erstellen und ihren Wert anzugeben. for(i in 1:3) { noquote(paste("a",i,sep=""))=i } In dem obigen Code, ich versuche zu erstellen a1, a2, a3, die assign zu den Werten von 1, 2, 3....
Ich habe gelernt, dass ich nicht die Rohdaten, sondern deren Residuen auf Normalität prüfen muss. Sollte ich Residuen berechnen und dann den Shapiro-Wilk-W-Test durchführen? Werden Residuen wie folgt berechnet: ?Xi−meanXi−meanX_i - \text{mean} Bitte sehen Sie diese vorherige Frage für meine Daten...
Wenn ich in einigen Softwarepaketen (z. B. Mathematica) eine lineare Regression durchführe, werden den einzelnen Parametern im Modell p-Werte zugeordnet. Zum Beispiel haben die Ergebnisse einer linearen Regression, die ein Ergebnis ergibt, einen p-Wert, der mit a assoziiert ist, und einen mit b...
Ich verwende ein GEE mit 3-Level-Daten, die nicht ausbalanciert sind, und benutze einen Logit-Link. Wie unterscheidet sich dies (in Bezug auf die Schlussfolgerungen, die ich ziehen kann, und die Bedeutung der Koeffizienten) von einem GLM mit gemischten Effekten (GLMM) und einem Logit-Link? Weitere...
In der Textklassifikation habe ich ein Trainingsset mit ca. 800 Samples und ein Testset mit ca. 150 Samples. Das Test-Set wurde noch nie verwendet und wartet darauf, bis zum Ende verwendet zu werden. Ich verwende das gesamte 800-Muster-Trainingsset mit 10-facher Kreuzvalidierung, während ich...
Ich habe oft Behauptungen gesehen, dass sie erschöpfend sein müssen (die Beispiele in solchen Büchern waren immer so, dass sie es tatsächlich waren), andererseits habe ich auch oft Bücher gesehen, die angaben, dass sie exklusiv sein sollten ( zum Beispiel als μ 1 = μ 2 und H 1 als μ 1 > μ 2 ),...
Ich habe eine Frage zu etwas, was mein Statistiklehrer zu folgendem Problem gesagt hat. Meine Frage bezieht sich nicht einmal auf das Auftreten von Simpsons Paradoxon in dieser Situation. Bei meiner Frage geht es einfach darum, dass mein Professor darauf besteht, dass A) und D) die richtigen...
Ich denke über die Diskussion um diese Frage und insbesondere über Frank Harrells Kommentar nach, dass die Varianzschätzung in einem reduzierten Modell (dh einer, aus der eine Reihe von erklärenden Variablen getestet und verworfen wurden) Yes allgemeine Freiheitsgrade verwenden sollte . Professor...
Insbesondere in der Verarbeitung natürlicher Sprachen ist bekannt, dass maschinelles Lernen in zwei Schritten ablaufen sollte, einem Trainingsschritt und einem Bewertungsschritt, und sie sollten unterschiedliche Daten verwenden. Warum ist das? Intuitiv hilft dieser Prozess, eine Überanpassung der...
Der bekannteste Algorithmus für Banditen ist der Upper Confidence Bound (UCB), der diese Klasse von Algorithmen bekannt gemacht hat. Seitdem gehe ich davon aus, dass es jetzt bessere Algorithmen gibt. Was ist der derzeit beste Algorithmus (in Bezug auf empirische Leistung oder theoretische...
Ein üblicher Vorverarbeitungsschritt für maschinelle Lernalgorithmen ist das Aufhellen von Daten. Es scheint, dass es immer gut ist, das Weißmachen durchzuführen, da die Daten dekorreliert werden, was die Modellierung vereinfacht. Wann wird Bleaching nicht empfohlen? Hinweis: Ich beziehe mich...
Gibt es ein Befehlszeilentool, das den Zahlenfluss (im ASCII-Format) von der Standardeingabe akzeptiert und die grundlegenden deskriptiven Statistiken für diesen Fluss liefert, z. B. Min, Max, Durchschnitt, Median, RMS, Quantile usw.? Die Ausgabe kann mit dem nächsten Befehl in der...