Wie wichtig ist ein Wert im Vergleich zu einer Werteliste? In den meisten Fällen wird bei statistischen Tests ein Probensatz mit einer Population verglichen. In meinem Fall wird die Stichprobe mit einem Wert erstellt und mit der Grundgesamtheit verglichen.
Ich bin ein Dilettant im Testen statistischer Hypothesen, der mit dem vielleicht grundlegendsten Problem konfrontiert ist. Es ist nicht nur ein Test, sondern Hunderte von ihnen. Ich habe einen Parameterraum und muss für jeden Punkt einen Signifikanztest durchführen. Für jede Parameterkombination werden sowohl Wert- als auch Hintergrundliste (Grundgesamtheit) generiert. Dann bestelle ich dies nach p-Wert und finde interessante Parameterkombinationen. Tatsächlich ist es auch wichtig, Parameterkombinationen zu finden, bei denen dieser p-Wert hoch ist (Nicht-Signifikanz).
Nehmen wir also einen einzigen Test: Ich habe einen berechneten Wert aus einem ausgewählten Satz und einen Hintergrundsatz von Werten, die durch Auswahl eines zufälligen Trainingssatzes berechnet wurden. Der berechnete Wert ist 0,35 und der Hintergrundsatz ist (wahrscheinlich?) Normalverteilt mit einem Mittelwert von 0,25 und einem sehr engen Standardwert (e-7). Ich habe eigentlich keine Kenntnisse über die Verteilung, da die Samples von etwas anderem berechnet werden, es sich nicht um Zufallszahlen-Samples von irgendeiner Verteilung handelt, also ist Hintergrund das richtige Wort dafür.
Die Nullhypothese würde lauten: "Der Mittelwert des Stichprobentests entspricht meinem berechneten Wert von 0,35". Wann sollte ich dies als Z-Test oder T-Test betrachten? Ich möchte, dass der Wert deutlich über dem Bevölkerungsdurchschnitt liegt, daher handelt es sich um einen einseitigen Test.
Ich bin etwas verwirrt, was als Stichprobe zu betrachten ist: Ich habe entweder eine Stichprobe (die Beobachtung) und die Hintergrundliste als Grundgesamtheit ODER meine Stichprobe ist die Hintergrundliste und ich vergleiche diese mit der Gesamtheit (ohne Stichprobe). Grundgesamtheit, die nach der Nullhypothese den gleichen Mittelwert haben soll. Sobald dies entschieden ist, geht der Test in verschiedene Richtungen, denke ich.
Wie berechne ich den p-Wert eines T-Tests? Ich würde es gerne selbst berechnen, anstatt eine R / Python / Excel-Funktion zu verwenden (ich weiß bereits, wie man das macht), daher muss ich zuerst die richtige Formel festlegen.
Zunächst vermute ich, dass ein T-Test etwas zu allgemein ist, da in meinem Fall der T-Test mit der Stichprobengröße verknüpft wäre und die Form hätte: wobei und s ist , die Stichprobe im Vergleich zur Grundgesamtheit. Ich habe also zwei Fälle: Entweder ist meine Stichprobengröße die Größe der Population, was "ich schätze", dass ich es mit einem Z-Test zu tun habe, oder die Populationsstatistik (n und std) ist unbekannt, aber die Verteilung kann in sein Irgendwie angenähert und ich habe es wirklich mit einem T-Test zu tun. In jedem Fall sind meine folgenden Fragen:
- Wie berechne ich einen p-Wert? (dh ohne eine R / Python / Excel-Funktion oder eine p-Wert-Tabellensuche zu verwenden, sondern sie tatsächlich basierend auf einer Formel zu berechnen, weil ich wissen möchte, was ich tue)
- Wie entscheide ich einen Signifikanzschwellenwert basierend auf meiner Stichprobengröße? (Eine Formel wäre schön)
quelle
Antworten:
Sie werfen eine interessante Frage auf. Wenn Sie als erstes eine Beobachtung von 0,35, einen Mittelwert von 0,25 und eine Standardabweichung von 1/10 ^ 7 haben (so interpretiere ich Ihr e ^ -7-Bit), brauchen Sie wirklich keine Hypothese aufzustellen Testübung. Ihre Beobachtung von 0,35 unterscheidet sich stark vom Mittelwert von 0,25, da sie einige Tausend Standardabweichungen vom Mittelwert und wahrscheinlich einige Millionen Standardfehler vom Mittelwert entfernt ist.
Der Unterschied zwischen dem Z-Test und dem T-Test bezieht sich hauptsächlich auf die Probengröße. Bei Stichproben unter 120 sollten Sie den t-Test verwenden, um p-Werte zu berechnen. Wenn die Stichprobengröße größer ist, spielt es keine große Rolle, welche Sie verwenden. Es macht Spaß, es unabhängig von der Stichprobengröße in beide Richtungen zu berechnen und zu beobachten, wie wenig Unterschied zwischen den beiden Tests besteht.
Was die Berechnung selbst angeht, können Sie den t stat berechnen, indem Sie die Differenz zwischen Ihrer Beobachtung und dem Mittelwert dividieren und durch den Standardfehler dividieren. Der Standardfehler ist die Standardabweichung geteilt durch die Quadratwurzel der Stichprobengröße. Jetzt haben Sie Ihren Status. Um einen p-Wert zu berechnen, gibt es meines Erachtens keine Alternative, als Ihren t-Wert am Testtisch nachzuschlagen. Wenn Sie eine einfache Excel-Alternative akzeptieren, ist TDIST (t stat value, DF, 1 oder 2 für 1 oder 2 tail p value) der Trick. Um einen p-Wert unter Verwendung von Z zu berechnen, lautet die Excel-Formel für einen 1-Schwanz-Test: (1 - NORMSDIST (Z-Wert). Der Z-Wert ist der gleiche wie der t-Wert (oder die Anzahl der Standardfehler, die vom Mittelwert abweichen).
Genau wie eine Einschränkung können diese Methoden des Hypothesentests durch die Stichprobengröße verzerrt werden. Mit anderen Worten, je größer Ihre Stichprobe ist, desto kleiner ist Ihr Standardfehler, desto höher ist Ihr resultierender Z-Wert oder t stat, desto niedriger ist der p-Wert und desto höher ist Ihre statistische Signifikanz. Als Abkürzung in dieser Logik führen große Stichprobengrößen zu einer hohen statistischen Signifikanz. Eine hohe statistische Signifikanz in Verbindung mit einer großen Stichprobengröße kann jedoch völlig unerheblich sein. Mit anderen Worten, statistisch signifikant ist eine mathematische Phrase. Dies bedeutet nicht unbedingt signifikant (nach Webster-Wörterbuch).
Um dieser großen Stichprobenfalle zu entkommen, haben Statistiker die Methoden der Effektgröße angewendet. Letztere verwenden als Einheit für den statistischen Abstand zwischen zwei Beobachtungen die Standardabweichung anstelle des Standardfehlers. Mit einem solchen Framework hat die Stichprobengröße keinen Einfluss auf Ihre statistische Signifikanz. Wenn Sie die Effektgröße verwenden, bewegen Sie sich in der Regel von den p-Werten weg und zu Konfidenzintervallen, die im Klartext aussagekräftiger sein können.
quelle
Hypothesentests beziehen sich immer auf die Grundgesamtheit. Wenn Sie eine Aussage über die Probe machen möchten, müssen Sie nicht testen (vergleichen Sie einfach, was Sie sehen). Häufige Anwender glauben an Asymptotik. Machen Sie sich also keine Sorgen über die Verteilung Ihrer Daten, solange Ihre Stichprobe groß ist. Z-Test und T-Test verhalten sich bei der Berechnung der Teststatistik grundsätzlich gleich, lediglich die kritischen Werte werden aus unterschiedlichen Verteilungen erhalten (Normal vs Student-T). Wenn Ihre Stichprobe groß ist, ist der Unterschied gering.
Zu Q1: Schauen Sie einfach von der T-Verteilung mit n-1 Freiheitsgraden nach, wobei n die Stichprobengröße ist.
Zu Q2: Sie berechnen den Schwellenwert basierend auf Ihrem gewünschten Signifikanzniveau für einen Z-Test und basierend auf dem Signifikanzniveau für die Stichprobengröße im Fall des T-Tests.
Aber im Ernst, sollten Sie einige Grundlagen überprüfen.
quelle