Warum wird die logistische Regression instabil, wenn die Klassen gut voneinander getrennt sind? Was bedeuten gut getrennte Klassen? Ich würde mich sehr freuen, wenn sich jemand mit einem Beispiel erklären
Warum wird die logistische Regression instabil, wenn die Klassen gut voneinander getrennt sind? Was bedeuten gut getrennte Klassen? Ich würde mich sehr freuen, wenn sich jemand mit einem Beispiel erklären
In einer kürzlich durchgeführten Aufgabe wurde uns befohlen, PCA für die MNIST-Ziffern zu verwenden, um die Abmessungen von 64 (8 x 8 Bilder) auf 2 zu reduzieren. Anschließend mussten wir die Ziffern mit einem Gaußschen Mischungsmodell gruppieren. PCA, das nur zwei Hauptkomponenten verwendet,...
Angenommen, ich untersuche, wie Narzissen auf verschiedene Bodenbedingungen reagieren. Ich habe Daten über den pH-Wert des Bodens im Vergleich zur reifen Höhe der Narzisse gesammelt. Da ich eine lineare Beziehung erwarte, gehe ich einer linearen Regression nach. Als ich mit meiner Studie begann,...
Bei vielen verschiedenen statistischen Methoden gibt es eine "Normalitätsannahme". Was ist "Normalität" und woher weiß ich, ob es Normalität
Mein Vater ist Mathematikbegeisterter, interessiert sich aber nicht besonders für Statistik. Es wäre ordentlich zu versuchen , einige der wunderbaren Teile der Statistik zu veranschaulichen, und das CLT ist ein erstklassiger Kandidat. Wie würden Sie die mathematische Schönheit und Wirkung des...
Ich suche ein gutes Buch / Tutorial, um mehr über die Überlebensanalyse zu erfahren. Ich bin auch an Referenzen zur Durchführung von Überlebensanalysen in R
Wenn ja, was? Wenn nein, warum nicht? Für eine Stichprobe auf der Linie minimiert der Median die absolute Gesamtabweichung. Es erscheint natürlich, die Definition auf R2 usw. zu erweitern, aber ich habe es nie gesehen. Aber dann bin ich schon lange im linken Feld
Ich verstehe, dass für bestimmte Datensätze wie die Abstimmung eine bessere Leistung erzielt wird. Warum wird die Poisson-Regression anstelle der normalen linearen oder logistischen Regression verwendet? Was ist die mathematische Motivation
Ich bin dabei, Medizinstudenten in diesem Semester Statistik beizubringen. Ich habe viele Horrorgeschichten über die Angst dieser Schüler gehört, Statistiken zu lernen. Kann jemand vorschlagen, was mit dieser Angst zu tun ist? (Entweder Links zu Personen, die dies diskutieren, oder Vorschläge aus...
Nehmen wir an, wir haben die Zufallsvariable mit bekannter Varianz und Mittelwert. Die Frage ist: Was ist die Varianz von für eine gegebene Funktion f. Die einzige allgemeine Methode, die mir bekannt ist, ist die Delta-Methode, die jedoch nur eine Annäherung darstellt. Jetzt interessiere ich mich...
Wie beurteilen wir anhand von zwei Histogrammen, ob sie ähnlich sind oder nicht? Reicht es aus, nur die beiden Histogramme zu betrachten? Bei der einfachen Eins-zu-Eins-Zuordnung tritt das Problem auf, dass ein Histogramm, das sich geringfügig unterscheidet und geringfügig verschoben ist, nicht...
Ich versuche zu verstehen, Standardfehler "Clustering" und wie in R auszuführen (es ist in Stata trivial). In RI ist es mir nicht gelungen, entweder plmmeine eigene Funktion zu verwenden oder zu schreiben. Ich werde die diamondsDaten aus dem ggplot2Paket verwenden. Ich kann feste Effekte mit...
Ich möchte wissen, ob es eine Boxplot-Variante gibt, die an verteilte Poisson-Daten (oder möglicherweise an andere Distributionen) angepasst ist. Bei einer Gaußschen Verteilung mit Whiskern bei L = Q1 - 1,5 IQR und U = Q3 + 1,5 IQR hat das Boxplot die Eigenschaft, dass es ungefähr so viele...
Andrew More definiert Informationsgewinn als: IG(Y|X)=H(Y)−H(Y|X)IG(Y|X)=H(Y)−H(Y|X)IG(Y|X) = H(Y) - H(Y|X) wobei H(Y|X)H(Y|X)H(Y|X) die bedingte Entropie ist . Wikipedia nennt die oben genannte Menge jedoch gegenseitige Informationen . Wikipedia hingegen definiert Informationsgewinn als die...
Ich habe vier verschiedene Zeitreihen von Stundenmessungen: Der Wärmeverbrauch in einem Haus Die Temperatur außerhalb des Hauses Die Sonnenstrahlung Die Windgeschwindigkeit Ich möchte den Wärmeverbrauch im Haus vorhersagen können. Es gibt einen klaren saisonalen Trend, sowohl auf jährlicher Basis...
Ich bin neu in der Modellierung mit neuronalen Netzwerken, aber es ist mir gelungen, ein neuronales Netzwerk mit allen verfügbaren Datenpunkten einzurichten, das gut zu den beobachteten Daten passt. Das neuronale Netzwerk wurde in R mit dem nnet-Paket erstellt: require(nnet) ##33.8 is the highest...
Ich habe ein Computerprogramm geschrieben, mit dem Münzen in einem statischen Bild (.jpeg, .png usw.) mithilfe einiger Standardtechniken für die Bildverarbeitung (Gaußscher Weichzeichner, Schwellenwert, Hough-Transformation usw.) erkannt werden können. Anhand der Verhältnisse der von einem...
Ich habe kürzlich gelernt, Bootstrapping-Techniken zu verwenden, um Standardfehler und Konfidenzintervalle für Schätzer zu berechnen. Was ich gelernt habe war, dass wenn die Daten IID sind, Sie die Probendaten als Grundgesamtheit behandeln und eine Stichprobenerhebung mit Ersatz durchführen können....
Ich habe einen Streaming-Datensatz, Beispiele sind einzeln verfügbar. Ich müsste sie in mehreren Klassen klassifizieren. Sobald ich dem Lernprozess ein Trainingsbeispiel gegeben habe, muss ich das Beispiel verwerfen. Gleichzeitig verwende ich auch das neueste Modell, um Vorhersagen für...
Einer der späten Beiträge von RA Fisher waren Bezugsintervalle und Argumente mit Bezugsprinzipien . Diese Herangehensweise ist jedoch bei weitem nicht so populär wie die von Frequentisten oder Bayes'schen Prinzipien geprägten Argumente. Was ist das Bezugsargument und warum wurde es nicht...