Statistiken und Big Data

9
Teile eines Songs erkennen

Hoffentlich ist das nicht zu subjektiv ... Ich suche nach einer Richtung, um die verschiedenen "Teile" eines Songs zu erkennen, unabhängig vom Musikstil. Ich habe keine Ahnung, wo ich suchen soll, aber ich vertraute auf die Leistung der anderen StackOverflow-Sites und dachte, jemand hier könnte...

9
Wie summiere ich zwei Variablen auf verschiedenen Skalen?

Wenn ich zwei Variablen habe, die zwei unterschiedlichen Verteilungen folgen und unterschiedliche Standardabweichungen haben ... Wie muss ich zwei Variablen transformieren, damit die beiden Ergebnisse, wenn ich sie summiere, nicht von einer volatileren "getrieben" werden? Zum Beispiel ... Variable...

9
Clustering mit asymmetrischen Abstandsmaßen

Wie gruppieren Sie ein Feature mit einem asymmetrischen Abstandsmaß? Angenommen, Sie gruppieren ein Dataset mit Wochentagen als Feature. Die Entfernung von Montag bis Freitag entspricht nicht der Entfernung von Freitag bis Montag. Wie integrieren Sie dies in das Abstandsmaß des...

9
Wie wähle ich die Anzahl der Teilungen in rpart ()?

Ich habe rpart.controlfür verwendet minsplit=2und habe die folgenden Ergebnisse von der rpart()Funktion erhalten. Muss ich Splits 3 oder Splits 7 verwenden, um eine Überanpassung der Daten zu vermeiden? Sollte ich nicht Splits 7 verwenden? Lass es mich wissen, bitte. Tatsächlich in der...

9
Ergebnisse der Ridge-Regression verstehen

Ich bin neu in der Gratregression. Als ich die lineare Gratregression anwendete, erhielt ich die folgenden Ergebnisse: >myridge = lm.ridge(y ~ ma + sa + lka + cb + ltb , temp, lamda = seq(0,0.1,0.001)) > select(myridge) modified HKB estimator is 0.5010689 modified L-W estimator is 0.3718668...

9
Verteilung der Standardabweichung

Diese Frage bezog sich auf die Normalverteilung, aber ich frage mich, was über die Verteilung der Standardabweichung einer Stichprobe der Größe n aus einer beliebigen Verteilung bekannt ist. Was ist insbesondere die Standardabweichung der Standardabweichung? Für eine Normalverteilung ist der sd des...

9
Boxplot für mehrere Distributionen?

Ich muss 20 Verteilungen in einem einzelnen Diagramm in R zeichnen, und es sieht für mich mit normalem Boxplot (20 Boxen) selbst mit Boxwex = 0,3 nicht gut (überladen) aus. Könnten Sie mir vorschlagen, wie ich eine Art Boxplot in R für die 20 Verteilungen zeichnen kann, mit Punkten für den Median...

9
Fallgewichtete logistische Regression

Ich betrachte einige logistische Regressionsprobleme. ("regulär" und "bedingt"). Im Idealfall möchte ich jeden der Eingabefälle gewichten, damit sich der glm mehr darauf konzentriert, die höher gewichteten Fälle korrekt vorherzusagen, auf Kosten einer möglichen Fehlklassifizierung der niedriger...

9
Allgemeine Hinweise zur Modellierung

Die Formulierung eines mathematischen Modells für ein Problem ist einer der subjektivsten Aspekte der Statistik, aber auch einer der wichtigsten. Was sind die besten Referenzen, die sich mit diesem entscheidenden, aber oft übersehenen Thema befassen? Und welcher berühmte Statistiker sagte etwas in...