Statistiken und Big Data

16
Clustering von 1D-Daten

Ich habe einen Datensatz, ich möchte Cluster auf diesen Daten basierend auf nur einer Variablen erstellen (es fehlen keine Werte). Ich möchte 3 Cluster basierend auf dieser einen Variablen erstellen. Welcher Clustering-Algorithmus soll verwendet werden, k-means, EM, DBSCAN usw.? Meine Hauptfrage...

16
Wie fange ich an und lerne R?

Ich habe mehrmals versucht, es "alleine zu machen" - aber mit begrenztem Erfolg. Ich bin ein gelegentlicher SPSS-Benutzer und habe einige SAS-Erfahrungen. Würde mich über einen oder zwei Zeiger von jemandem freuen, der einen ähnlichen Hintergrund hat und jetzt R

16
Große, kluge Einsätze machen

Ich habe versucht, einen Algorithmus zu programmieren, der Wetten in 1X2-Spielen (gewichtet) vorschlägt. Grundsätzlich hat jedes Spiel eine Reihe von Spielen (Heim- gegen Auswärtsteams): 1: Heimsiege X: zeichnen 2: auswärts gewinnt Für jede Übereinstimmung und jedes Symbol ( 1, Xund 2) werde ich...

16
Was ist die statistische Begründung der Interpolation?

Angenommen, wir haben zwei Punkte (die folgende Abbildung: schwarze Kreise) und möchten einen Wert für einen dritten Punkt zwischen ihnen finden (Kreuz). In der Tat werden wir es basierend auf unseren experimentellen Ergebnissen, den schwarzen Punkten, schätzen. Am einfachsten ist es, eine Linie zu...

16
Wo finde ich einen großen Textkorpus? [geschlossen]

Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Kreuz Validated. Geschlossen vor 6 Jahren . Ich suche einen großen (>...

16
Rechengeschwindigkeit in R?

Ich wurde beauftragt, eines unserer aktuellen großen stochastischen Modelle aus SAS in eine neue Sprache zu überführen. Persönlich bevorzuge ich eine traditionell kompilierte Sprache, aber der PI möchte, dass ich R auschecke, das ich nie benutzt habe. Unsere Motivation, das Modell aus SAS...

16
Intuition hinter der Potenzgesetzverteilung

Ich weiß, dass das PDF einer Potenzgesetzverteilung p ( x ) = α - 1xMindest( xxMindest)- αp(x)=α-1xMindest(xxMindest)-α p(x) = \frac{\alpha-1}{x_{\text{min}}} \left(\frac{x}{x_{\text{min}}} \right)^{-\alpha} Was aber bedeutet es intuitiv, wenn beispielsweise Aktienkurse einer Potenzgesetzverteilung...

16
Wie finde ich lokale Gipfel / Täler in einer Reihe von Daten?

Hier ist mein Experiment: Ich benutze die findPeaksFunktion im quantmod- Paket: Ich möchte "lokale" Peaks innerhalb einer Toleranz 5 erkennen, dh die ersten Stellen nach der Zeitreihe fallen um 5 von den lokalen Peaks ab: aa=100:1 bb=sin(aa/3) cc=aa*bb plot(cc, type="l") p=findPeaks(cc,...