Ich verstehe nicht, warum die Reduzierung der Dimension wichtig ist. Was ist der Vorteil, wenn einige Daten erfasst und ihre Dimension reduziert
Ich verstehe nicht, warum die Reduzierung der Dimension wichtig ist. Was ist der Vorteil, wenn einige Daten erfasst und ihre Dimension reduziert
Angenommen, wir haben ein lineares Modell , das alle Standardannahmen für die Regression (Gauss-Markov) erfüllt. Wir interessieren uns für .yi=β0+β1xi+ϵiyi=β0+β1xi+ϵiy_i = \beta_0 + \beta_1 x_i + \epsilon_iθ=1/β1θ=1/β1\theta = 1/\beta_1 Frage 1: Welche Annahmen sind notwendig, damit die Verteilung...
Einführung In der Prognosekombination basiert eine der beliebtesten Lösungen auf der Anwendung einiger Informationskriterien. Wenn man zum Beispiel das für das Modell geschätzte Akaike-Kriterium , könnte man die Differenzen von von und dann könnte RP_j = e ^ {(AIC ^ * - AIC_j) / 2} interpretiert...
Ich habe einige Daten über die Zeit zwischen den Herzschlägen eines Menschen. Ein Hinweis auf ektopische (zusätzliche) Beats ist, dass diese Intervalle um drei Werte anstatt um einen gruppiert sind. Wie kann ich ein quantitatives Maß dafür erhalten? Ich möchte mehrere Datensätze vergleichen, und...
Ich habe Box-Plots von 13 Gruppen, die ich in einem Plot zeige. Die Gruppen haben unausgeglichene Bevölkerungsgruppen und sind nicht normal verteilt. Ich möchte zeigen, welche Paare statistisch ähnlich sind (dh kruskal.test p-Wert <0,05 haben), indem ich a, b, c usw. auf übereinstimmende...
Wenn ich eine Variable mit 4 Ebenen habe, muss ich theoretisch 3 Dummy-Variablen verwenden. Wie wird dies in der Praxis tatsächlich durchgeführt? Benutze ich 0-3, benutze ich 1-3 und lasse die 4 leer? Irgendwelche Vorschläge? HINWEIS: Ich werde in R arbeiten. UPDATE: Was würde passieren, wenn ich...
Ich habe in diesem Jahr meine Promotion in Statistik begonnen und suche nach Ihren Best Practices, Ratschlägen und (Meta-Ratschlägen), wie Sie wachsen und ein guter akademischer Forscher in den Bereichen Statistik / ML werden können. Allgemeine Gedanken und Links sind willkommen, aber um den Ball...
Wenn wir annehmen, dass unsere Datenpunkte von der Oberfläche einer Kugel abgetastet wurden (mit einer gewissen Störung), wie können wir dann den Mittelpunkt dieser Kugel wiederherstellen? Bei meiner Suche fand ich Artikel über etwas, das als "sphärische Regression" bezeichnet wurde, aber es...
In R ist c (3,1,0) * c (2,0,1) == c (6,0,0). Dies ist kein Punktprodukt und kein Kreuzprodukt. Erstens, wie heißt dieses Produkt und zweitens funktioniert es in WinBUGS, OpenBUGS und / oder
Ich habe diesen Artikel über "Wie man keinen A / B-Test durchführt" gelesen . Und ich verstehe immer noch nicht genau, was der Autor argumentiert. Kann es jemand für mich dumm machen? Ich denke, was es sagen könnte, ist, dass mich das Lesen der Ergebnisse meiner Split-Tests im Laufe der Zeit...
Angenommen, ich generiere die Wahrscheinlichkeit eines Ergebnisses basierend auf einem bestimmten Faktor und zeichne die Kurve dieses Ergebnisses. Gibt es eine Möglichkeit, die Gleichung für diese Kurve aus R zu extrahieren? > mod = glm(winner~our_bid, data=mydat,
Ist Kollers "Probabilistic Graphical Models" als Lehrbuch geeignet? Oder gibt es ein anderes Buch, das als Lehrbuch für einen Meisterkurs empfehlenswerter ist? Haftungsausschluss: Cross-Posting von quora.com, wo ich keine Antwort
Wenn ich Ihnen drei Zahlen gebe, die unabhängig und identisch aus einer Standardnormalverteilung stammen, habe ich Ihnen dann drei oder eine Stichprobe gegeben? Wenn die Antwort ein Beispiel ist, gibt es dann einen kurzen Namen für das, wovon ich Ihnen drei gegeben
Ich versuche, ein Vorhersagemodell mit SVMs auf ziemlich unausgeglichenen Daten aufzubauen. Meine Labels / Outputs haben drei Klassen: positiv, neutral und negativ. Ich würde sagen, das positive Beispiel macht ungefähr 10 - 20% meiner Daten aus, neutral ungefähr 50 - 60% und negativ ungefähr 30 -...
Ich habe einige Zeitreihendaten, bei denen die Messgröße diskrete positive ganze Zahlen (Zählungen) sind. Ich möchte testen, ob es im Laufe der Zeit einen Aufwärtstrend gibt (oder nicht). Die unabhängige Variable (x) liegt im Bereich von 0 bis 500 und die abhängige Variable (y) liegt im Bereich von...
Frage: Gibt es allgemeine Richtlinien in Bezug auf die Eingabedateneigenschaften, anhand derer zwischen der Anwendung von PCA und LSA / LSI entschieden werden kann? Kurze Zusammenfassung von PCA vs. LSA / LSI: Die Hauptkomponentenanalyse (PCA) und die latente semantische Analyse (LSA) oder die...
Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Kreuz Validated. Geschlossen vor 8 Monaten . Das in dieser Frage erwähnte Problem wurde in Version 1.7.3 des R-Pakets...
BIC bestraft basierend auf der Anzahl der Parameter. Was ist, wenn einige der Parameter binäre Indikatorvariablen sind? Zählen diese als vollständige Parameter? Aber ich kann Binärparameter zu einer diskreten Variablen kombinieren , die Werte in annimmt . Sollen diese als Parameter oder als ein...
Eine Münze wird 900 Mal geworfen und Köpfe erschienen 490 Mal. Unterstützt das Ergebnis die Hypothese, dass die Münze unvoreingenommen
Was ist der Unterschied zwischen einem GLM-Modell (logistische Regression) mit einer binären Antwortvariablen, die Subjekt und Zeit als Kovariaten enthält, und dem analogen GEE-Modell, das die Korrelation zwischen Messungen zu mehreren Zeitpunkten berücksichtigt? Mein GLM sieht aus...