Statistiken und Big Data

14
Wie berechne ich, ob meine lineare Regression einen statistisch signifikanten Unterschied zu einer bekannten theoretischen Linie aufweist?

Ich habe einige Daten, die entlang einer ungefähr linearen Linie passen: Wenn ich eine lineare Regression dieser Werte durchführe, erhalte ich eine lineare Gleichung: y=0.997x−0.0136y=0.997x−0.0136y = 0.997x-0.0136 In einer idealen Welt, die Gleichung sollte seine .y=xy=xy = x Offensichtlich liegen...

14
Warum brauchen wir einen Schätzer, um konsistent zu sein?

Ich denke, ich habe die mathematische Definition eines konsistenten Schätzers bereits verstanden. Korrigiere mich, wenn ich falsch liege: WnWnW_n ist ein konsistenter Schätzer für wennθθ\theta∀ϵ>0∀ϵ>0\forall \epsilon>0 limn→∞P(|Wn−θ|>ϵ)=0,∀θ∈Θlimn→∞P(|Wn−θ|>ϵ)=0,∀θ∈Θ\lim_{n\to\infty}...

14
Warum sollten sie hier eine Gammaverteilung wählen?

In einer der Übungen für meinen Kurs verwenden wir einen medizinischen Datensatz von Kaggle . Die Übung sagt: Wir möchten die Verteilung der einzelnen Gebühren modellieren und wir möchten auch in der Lage sein, unsere Unsicherheit über diese Verteilung zu erfassen, damit wir den Wertebereich,...

13
Daten Anonymisierungssoftware

Verschlossen . Diese Frage und ihre Antworten sind gesperrt, da die Frage nicht zum Thema gehört, aber von historischer Bedeutung ist. Derzeit werden keine neuen Antworten oder Interaktionen akzeptiert. Kennt jemand eine gute Datenanonymisierungssoftware? Oder vielleicht...