Was bedeutet Theta?

16

Ich bin ein Neuling in der Statistik und habe dies gefunden .

In der Statistik ist θ, der griechische Kleinbuchstabe 'Theta', der übliche Name für einen (Vektor von) Parameter (n) einer allgemeinen Wahrscheinlichkeitsverteilung. Ein häufiges Problem besteht darin, den oder die Werte von Theta zu finden. Beachten Sie, dass die Benennung eines Parameters auf diese Weise keine Bedeutung hat. Wir könnten es genauso gut anders nennen. Tatsächlich haben viele Distributionen Parameter, denen normalerweise andere Namen gegeben werden. Beispielsweise ist es üblich, den Mittelwert und die Abweichung der Normalverteilung μ (gelesen: "mu") bzw. der Abweichung σ ("Sigma") zu benennen.

Aber ich weiß immer noch nicht, was das im Klartext bedeutet?

Kamilski81
quelle
10
θ ist nur ein mathematisches Symbol und bedeutet verschiedene Dinge in verschiedenen Kontexten. Manchmal wird ; verwendet, um sich auf einen zu schätzenden Parameter zu beziehen, aber es gibt keine echte Antwort auf die Frage "Was ist ;?". Das ist wie die Frage "Was ist der Buchstabe A?". Ihr Link weist sogar darauf hin, wenn er lautet: "Beachten Sie, dass es keine Bedeutung hat, einen Parameter auf diese Weise zu benennen. Wir könnten es genauso gut anders nennen." . θθ
Makro
Es ist nur eine Möglichkeit, einen statistischen Parameter (der die Verteilung der mit diesem 'Parameter' verknüpften Menge definiert) mit einem speziellen Buchstaben (außer englischen Buchstaben) zu benennen.
Stat-R
4
Die meisten von uns würden dieses Zitat in der Tat als sehr klares Englisch ansehen, aber um Fortschritte zu erzielen, müssen wir akzeptieren, dass es nicht darum geht, wie man Englisch liest. Worum könnte es dann gehen? Ich gehe davon aus, dass es darum geht, die technischen Begriffe im Zitat zu erläutern : die, mit denen wir so vertraut sind, dass wir nicht mehr sehen, wie seltsam sie für statistisch Uneingeweihte sein könnten. Dies erfordert, dass wir uns mit den Bedeutungen von Verteilung und Parametern befassen (einer Verteilung, die nicht einer angepassten Kurve oder einem anderen deterministischen Modell entspricht).
Whuber

Antworten:

31

Es ist keine Konvention, aber oft steht für den Parametersatz einer Distribution.θ

Das war es für einfaches Englisch, lassen Sie uns stattdessen Beispiele zeigen.

Beispiel 1. Sie möchten den Wurf einer altmodischen Reißzwecke untersuchen (die mit einem großen runden Boden). Sie nehmen an, dass die Wahrscheinlichkeit, dass es herunterfällt, ein unbekannter Wert ist, den Sie . Sie können eine Zufallsvariable aufrufen und sagen, dass X = 1 ist, wenn die Reißzwecke nach unten fallen, und X = 0, wenn sie nach oben fallen. Sie würden das Modell schreibenXθXX=1X=0

P(X=1)=θP(X=0)=1θ,

und Sie wären an der Schätzung von interessiert (hier zeigt die Wahrscheinlichkeit, dass die Reißzwecke abfallen, nach unten).θ

Beispiel 2. Sie möchten den Zerfall eines radioaktiven Atoms untersuchen. Aufgrund der Literatur wissen Sie, dass die Menge an Radioaktivität exponentiell abnimmt, und entscheiden sich daher, die Zeit bis zum Zerfall mit einer Exponentialverteilung zu modellieren. Wenn die Zeit bis zur Auflösung ist, ist das Modellt

f(t)=θeθt.

Hier ist eine Wahrscheinlichkeitsdichte, was bedeutet , dass die Wahrscheinlichkeit , dass das Atom zerfällt in dem Zeitintervall ( t , t + d t ) ist f ( t ) d t . Auch hier werden Sie daran interessiert sein, θ (hier die Zerfallsrate) zu schätzen .f(t)(t,t+dt)f(t)dtθ

Beispiel 3. Sie möchten die Präzision einer Waage untersuchen. Aufgrund der Literatur wissen Sie, dass die Messungen Gauß'sch sind, und entscheiden sich daher für die Modellierung des Gewichts eines Standardobjekts mit 1 kg

f(x)=1σ2πexp{(xμ2σ)2}.

Hier ist das durch die Skala gegebene Maß, f ( x ) ist die Wahrscheinlichkeitsdichte und die Parameter sind μ und σ , also θ = ( μ , σ ) . Der Parameter μ ist das Zielgewicht (die Waage ist vorgespannt, wenn μ 1 ist ), und σ ist die Standardabweichung des Maßes bei jedem Wiegen des Objekts. Auch hier werden Sie daran interessiert sein, θ zu schätzen (hier die Abweichung und die Ungenauigkeit der Skala).xf(x)μσθ=(μ,σ)μμ1σθ

gui11aume
quelle
1
+1 FWIW, ich habe kürzlich unter stats.stackexchange.com/a/34894 ein entsprechendes Beispiel veröffentlicht . Obwohl es irreführend wäre, es als "normales Englisch" zu interpretieren - es scheut nicht, Fachbegriffe zu verwenden -, habe ich mich bemüht, so klar und kurz wie möglich zu erklären, was vor sich geht, welche Annahmen getroffen werden und wie Arbeitet mit einer parametrisierten Familie von Verteilungen, um eine Schätzung basierend auf Daten zu erstellen. Für einige ist dies möglicherweise eine informative Ergänzung zu Ihrer Antwort hier.
Whuber
1
Gute Antwort! Ich bin verwirrt, wenn Sie sagen, dass die Skala voreingenommen ist, wenn mu! = 1 ist. Tatsächlich wird beim "Normalisieren" die Standardnormalverteilung zu x ~ N (0, 1). Oder auf Englisch mu = 0 und Varianz = 1. Siehe z. B. en.wikipedia.org/wiki/…
Mike Williamson
Ich meine nur, dass das Instrument eine Abweichung hat, wenn es etwas anderes als 1 kg anzeigt, wenn es ein 1 kg schweres Objekt misst. Vielleicht ist das Wort "Skala" verwirrend. Hier bezeichnet es nur das Instrument.
gui11aume
3

Worauf sich bezieht, hängt davon ab, mit welchem ​​Modell Sie arbeiten. Beispielsweise modellieren Sie in der gewöhnlichen Regression kleinster Quadrate eine abhängige Variable (in der Regel als Y bezeichnet) als lineare Kombination einer oder mehrerer unabhängiger Variablen (in der Regel als X bezeichnet) und erhalten so etwas wieθ

Yi=b0+b1x1+b2x2+...+bpxp

Dabei ist p die Anzahl der unabhängigen Variablen. Die hier zu schätzenden Parameter sind die und θ ist ein Name für alle β s . Aber θ ist allgemeiner auf alle Parameter gelten können wir abschätzen wollen.βsθβsθ

Peter Flom - Wiedereinsetzung von Monica
quelle
3
Peter, obwohl man nicht genau sagen habe, bin ich diese Antwort Angst ein Anfänger den falschen Eindruck geben kann , dass das Symbol wird immer auf einen Parametervektor beziehen und umgekehrt, dass dies der einzige Weg ist , um einen Parameter zu beziehen Wert. Wie mein Kommentar oben zeigt, denke ich, ist die Antwort nichts weiter als " θ ist ein mathematisches Symbol", was es nicht wirklich zu einer statistischen Frage macht. θθ
Makro
1
@Macro Ich denke, in diesem Zusammenhang ist es klar, dass dies die Bedeutung von , die Kamilski wollte. Sicher, jedes Symbol kann sich auf alles beziehen. Aber in diesem Absatz bedeutet Makro Sie und nicht einen Kurs in Wirtschaftswissenschaften oder einen Teil von SAS oder so weiter. θ
Peter Flom - Reinstate Monica
1
Ok, ich denke nicht, dass Analogie wirklich passend ist, aber ich werde es als Versuch einer Übertreibung ansehen. Auf jeden Fall beziehe ich mich wirklich auf etwas sehr Grundsätzliches, nämlich, dass Anfänger der Mathematik die Notation oft als etwas inhärent Bedeutungsvolles und als etwas anderes als das verwechseln, was es ist - einfach ein Etikett. Mein Punkt war, dass diese Antwort (ich denke ungewollt) nichts gegen diese Idee unternimmt. Wie Sie wissen, kann auf andere Dinge verweisen, auf die ein Statistiker stoßen kann. Beispielsweise werden Winkel oft mit θ bezeichnet . θθ
Makro
4
Diese Erklärung ist zwar klar und technisch korrekt, bezieht jedoch keinerlei Verteilungen ausdrücklich mit ein und scheint daher für das Zitat in der Frage nicht relevant zu sein.
whuber
1

In reinem Englisch:

Die statistische Verteilung ist eine mathematische Funktion , die Ihnen sagt, mit welcher Wahrscheinlichkeit unterschiedliche Werte Ihrer Zufallsvariablen X die Verteilung f haben , dh f ( x ) gibt eine Wahrscheinlichkeit von x aus . Es gibt verschiedene solche Funktionen , aber jetzt betrachten wir f als eine Art "allgemeine" Funktion.f Xff(x)xf

Damit jedoch universell ist, dh auf verschiedene Daten angewendet werden kann (die ähnliche Eigenschaften aufweisen), sind Parameter erforderlich , die ihre Form ändern, damit sie für verschiedene Daten geeignet sind. Ein einfaches Beispiel für einen solchen Parameter ist μ in Normalverteilung, das angibt, wo sich der Mittelpunkt (Mittelwert) dieser Verteilung befindet, und daher Zufallsvariablen mit unterschiedlichen Mittelwerten beschreiben kann. Die Normalverteilung hat einen anderen Parameter & sgr; und andere Verteilungen haben auch mindestens einen solchen Parameter. Die Parameter werden oft als θ , wobei für die Normalverteilung θ ist eine Abkürzung für sowohl μ und σfμσθθμσ(dh ist ein Vektor der beiden Werte).

θμμ=0μμμ=50θθ

θ

Tim
quelle