Warum werden Dispersionsmaße relativ zu einem zentralen Punkt berechnet? Warum wären beispielsweise nicht alle möglichen nicht wiederholten paarweisen Unterschiede im Datensatz ein gültiges Maß für die
Warum werden Dispersionsmaße relativ zu einem zentralen Punkt berechnet? Warum wären beispielsweise nicht alle möglichen nicht wiederholten paarweisen Unterschiede im Datensatz ein gültiges Maß für die
Diese Frage hat hier bereits Antworten : Ist mein Modell basierend auf dem Wert der Diagnosemetrik ( / AUC / Genauigkeit / RMSE usw.) gut? R.2R2R^2 (3 Antworten) Geschlossen vor 7 Monaten . Ich habe Lerndaten, die aus ~ 45.000 Stichproben bestehen, jede hat 21...
Angesichts des folgenden Datenrahmens: df <- data.frame(x1 = c(26, 28, 19, 27, 23, 31, 22, 1, 2, 1, 1, 1), x2 = c(5, 5, 7, 5, 7, 4, 2, 0, 0, 0, 0, 1), x3 = c(8, 6, 5, 7, 5, 9, 5, 1, 0, 1, 0, 1), x4 = c(8, 5, 3, 8, 1, 3, 4, 0, 0, 1, 0, 0), x5 = c(1, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 0), x6 = c(2, 3,...
Ich verstehe, dass die Koeffizienten einer logistischen Gleichung als ungerades Verhältnis interpretiert werden können. Wie ändert sich die Interpretation der Koeffizienten, wenn ein Regularisierungsterm zur Kontrolle der Überanpassung hinzugefügt
Ich verwende das bnlearn-Paket in R, um die Struktur meines Bayes'schen Netzwerks und seine Parameter zu lernen. Was ich tun möchte, ist, den Wert eines Knotens anhand des Werts anderer Knoten als Beweis "vorherzusagen" (offensichtlich mit Ausnahme des Knotens, dessen Werte wir vorhersagen). Ich...
Sollte man immer erwarten, dass die zentrale Tendenz (dh der Mittelwert und / oder der Median) einer Bootstrap-Probe dem beobachteten Wert ähnlich ist? In diesem speziellen Fall habe ich Antworten, die für Probanden unter zwei Bedingungen exponentiell verteilt sind (ich habe das Experiment nicht...
Ich habe eine Intervallzensur-Überlebenskurve mit R, JMP und SAS durchgeführt. Beide gaben mir identische Grafiken, aber die Tabellen unterschieden sich ein wenig. Dies ist die Tabelle, die JMP mir gegeben hat. Start Time End Time Survival Failure SurvStdErr . 14.0000 1.0000 0.0000 0.0000 16.0000...
Angenommen, ich habe eine große Stichprobe von Werten in [0,1][0,1][0,1] . Ich möchte die zugrunde liegende Beta(α,β)Beta(α,β)\text{Beta}(\alpha, \beta) -Verteilung schätzen . Der Großteil der Proben stammt aus dieser angenommenen Beta(α,β)Beta(α,β)\text{Beta}(\alpha, \beta) -Verteilung, während...
Einige wissenschaftliche Arbeiten berichten über Ergebnisse der parallelen Analyse der Hauptachsenfaktoranalyse in einer Weise, die nicht mit meinem Verständnis der Methodik vereinbar ist. Was vermisse ich? Bin ich falsch oder sind sie. Beispiel: Daten: Die Leistung von 200 einzelnen Menschen...
Ich habe einen Datensatz mit einer binären (Überlebens-) Antwortvariablen und 3 erklärenden Variablen ( A= 3 Ebenen, B= 3 Ebenen, C= 6 Ebenen). In diesem Datensatz sind die Daten mit 100 Personen pro ABCKategorie ausgewogen . Ich studierte bereits die Wirkung von diesen A, Bund CVariablen , die mit...
Ich habe zwei unabhängige Poisson-Prozesse und mit den Ankunftsraten bzw. . Die erwartete Zeit für das Eintreffen des nächsten Elements für den zusammengeführten Prozess sollte nun .AAABBBλAλA\lambda_AλBλB\lambda_B1λA+λB1λA+λB\frac {1}{\lambda_A+\lambda_B} Angenommen, ist die Ankunftszeit für das...
Wie kann man objektiv ("algorithmisch" gelesen) ein geeignetes Modell für eine einfache lineare Regression der kleinsten Quadrate mit zwei Variablen auswählen? Angenommen, die Daten scheinen einen quadratischen Trend zu zeigen, und es wird eine Parabel generiert, die recht gut zu den Daten passt....
Ich eine logistische Regression mit unabhängigen Variablen und Beobachtungen durch. Ich bewerte die Modellanpassung, um festzustellen, ob die Daten den Modellannahmen entsprechen, und habe mit dem Paket das folgende gruppierte Restdiagramm erstellt:242424123,996123,996123,996arm R Offensichtlich...
Ich habe versucht, Informationen zu dieser Art von Diagramm zu finden und immer wieder unbeabsichtigte Ergebnisse zu erhalten. Gibt es einen Namen oder einen Suchbegriff, um Balkendiagramme zu finden, die die Balken durch farbcodierte Objekte wie in diesem Beispiel ersetzen: Wenn jemand...
Für die Regressionsanalyse ist es häufig hilfreich, den Datengenerierungsprozess zu kennen, um zu überprüfen, wie die verwendete Methode funktioniert. Während es für eine einfache lineare Regression ziemlich einfach ist, dies zu tun, ist dies nicht der Fall, wenn die abhängige Variable einer...
Ich habe Daten, die einen Aspekt des menschlichen Verhaltens darstellen. Ich möchte es (unbeaufsichtigt) in irgendeine Art von Verhaltensprofilen gruppieren. Jetzt sind einige meiner Variablen kategorisch (mit 2 oder mehr Kategorien) und einige sind kontinuierlich (die meisten sind Prozentsätze)....
Ich habe die folgende Frage als Testfrage für meine Prüfung erhalten und kann die Antwort einfach nicht verstehen. Ein Streudiagramm der auf die ersten beiden Hauptkomponenten projizierten Daten ist unten gezeigt. Wir möchten untersuchen, ob der Datensatz eine Gruppenstruktur enthält. Zu diesem...
Ich habe eine Frage zu Clustern, die ich mit einem nichtparametrischen Mischungsansatz behandeln möchte (glaube ich). Ich arbeite an der Erklärung des menschlichen Verhaltens. Jede Zeile meiner Datenbank enthält: die ID von jemandem einige Parameter der Umgebung X (Beispiel: Temperatur, Wind usw.)...
Situation: Angenommen, ich habe einen Poisson-Prozess wie den radioaktiven Zerfall, bei dem R- Partikel pro Sekunde erzeugt werden. Ich messe mit einem Detektor. Es besteht eine Wahrscheinlichkeit P, dass ein Partikel vom Detektor erfasst wird. Dinge, die ich zu wissen glaube: Die...
Problem: Ich möchte eine Gibbs-Stichprobe durchführen, um einen posterioren Wert über einen großen Datensatz abzuleiten. Leider ist mein Modell nicht sehr einfach und daher ist die Abtastung zu langsam. Ich würde Variations- oder Parallelansätze in Betracht ziehen, aber bevor ich so weit gehe ......