Statistiken und Big Data

22
Sind inkonsistente Schätzer jemals vorzuziehen?

Konsistenz ist offensichtlich ein natürlicher und wichtiger Eigenschaftsschätzer, aber gibt es Situationen, in denen es besser ist, einen inkonsistenten Schätzer als einen konsistenten zu verwenden? Gibt es Beispiele für einen inkonsistenten Schätzer, der einen vernünftigen konsistenten Schätzer...

22
Führen Sie K-Means-Clustering (oder ein Clustern seiner nahen Verwandten) nur mit einer Distanzmatrix durch, nicht mit Daten zu Punkten nach Merkmalen

Ich möchte K-Means-Clustering für Objekte ausführen, die ich habe, aber die Objekte werden nicht als Punkte im Raum beschrieben, dh nach objects x featuresDatensatz. Ich kann jedoch den Abstand zwischen zwei beliebigen Objekten berechnen (er basiert auf einer Ähnlichkeitsfunktion). Also verfüge ich...

22
Erwarteter Wert eines natürlichen Logarithmus

Ich kenne mit a , b- Konstanten, also ist es bei gegebenem E ( X ) einfach zu lösen. Ich weiß auch, dass man das nicht anwenden kann, wenn es eine nichtlineare Funktion ist, wie in diesem Fall E ( 1 / X ) ≠ 1 / E ( X ) , und um das zu lösen, muss ich eine Approximation mit machen Taylors. Meine...

22
Regression für ein Modell der Form

Ich habe einen Datensatz, bei dem es sich um Statistiken aus einem Webdiskussionsforum handelt. Ich schaue auf die Verteilung der Anzahl der Antworten, die ein Thema haben soll. Insbesondere habe ich ein Dataset erstellt, das eine Liste der Themenantworten und anschließend die Anzahl der Themen mit...