Was ist ein robuster statistischer Test? Was ist ein leistungsfähiger statistischer Test?

14

Einige statistische Tests sind robust und andere nicht. Was genau bedeutet Robustheit? Überraschenderweise konnte ich auf dieser Seite keine solche Frage finden.

Darüber hinaus werden manchmal die Robustheit und die Leistungsfähigkeit eines Tests gemeinsam erörtert. Und intuitiv konnte ich nicht zwischen den beiden Konzepten unterscheiden. Was ist ein leistungsfähiger Test? Wie unterscheidet es sich von einem robusten statistischen Test?

Jetlag
quelle
2
Leistung und Robustheit sind orthogonale Konzepte, auch wenn sie zwei wichtige Eigenschaften eines Tests sind. Mir scheint, es wäre besser, zwei getrennte Fragen zu stellen.
S. Kolassa - Setzen Sie Monica
2
Wir könnten Robustheit als die Eigenschaft einer angepassten Prozedur bezeichnen, die unempfindlich gegenüber Verstößen gegen einige Annahmen ihrer Kerntheorie ist.
Firebug

Antworten:

21

Robustheit hat in der Statistik verschiedene Bedeutungen, aber alle implizieren eine gewisse Widerstandsfähigkeit gegenüber Änderungen in der Art der verwendeten Daten. Dies mag etwas mehrdeutig klingen, aber das liegt daran, dass sich Robustheit auf verschiedene Arten der Unempfindlichkeit gegenüber Änderungen beziehen kann. Beispielsweise:

  • Robustheit gegenüber Ausreißern
  • Robustheit gegen Nichtnormalität
  • Robustheit gegenüber nicht konstanter Varianz (oder Heteroskedastizität)

Bei Tests bezieht sich Robustheit normalerweise darauf, dass der Test bei einer solchen Änderung noch gültig ist. Mit anderen Worten, ob das Ergebnis signifikant ist oder nicht, ist nur dann von Bedeutung, wenn die Annahmen des Tests erfüllt sind. Wenn solche Annahmen gelockert werden (dh nicht so wichtig sind), wird der Test als robust bezeichnet.

Die Stärke eines Tests ist seine Fähigkeit, einen signifikanten Unterschied festzustellen, wenn es einen echten Unterschied gibt. Der Grund, warum spezifische Tests und Modelle mit verschiedenen Annahmen verwendet werden, besteht darin, dass diese Annahmen das Problem vereinfachen (z. B. dass weniger Parameter geschätzt werden müssen). Je mehr Annahmen ein Test macht, desto weniger robust ist er, da alle diese Annahmen erfüllt sein müssen, damit der Test gültig ist.

Andererseits ist ein Test mit weniger Annahmen robuster. Robustheit geht jedoch in der Regel mit Stromkosten einher, da entweder weniger Informationen aus der Eingabe verwendet werden oder mehr Parameter geschätzt werden müssen.


t

t


FF

Frans Rodenburg
quelle
1
Ihre Antwort ist sehr klar und leicht zu verstehen. Ich habe nach Fragen bearbeitet, um mehr darüber zu fragen, ob ein Test so ist, powerfulwie ich es in Ihrer Antwort beschrieben habe. Würde es Ihnen etwas ausmachen zu erklären, was ein leistungsfähiger Test bedeutet?
JetLag
Ich habe eine kurze Beschreibung beigefügt, wie dies mit der Leistungsfähigkeit eines Tests zusammenhängt.
Frans Rodenburg
1
Dies ist eine großartige Antwort. Ich möchte nur hinzufügen, dass es Möglichkeiten gibt, die Definition zu formalisieren. Einige halten einen Test für robust, wenn er sowohl die Robustheit der Gültigkeit aufweist , dh das Signifikanzniveau des Tests ist bei kleinen Abweichungen von der Null stabil, als auch die Robustheit der Effizienz , dh die Leistung ist bei kleinen Abweichungen von der angegebenen Alternative immer noch gut; und diese Qualitäten können durch die Verwendung von Einflussfunktionen quantifiziert werden .
Francis
1
@Eric, gilt die Äquivalenz nicht nur für zwei Gruppen?
Sextus Empiricus
1
F
3

Es gibt keine formale Definition des Begriffs "robuster statistischer Test", aber es besteht eine allgemeine Übereinstimmung darüber, was dies bedeutet. Die Wikipedia-Website hat eine gute Definition davon (in Bezug auf die Statistik und nicht auf den Test selbst):

Robuste Statistiken sind Statistiken mit guter Leistung für Daten, die aus einem breiten Bereich von Wahrscheinlichkeitsverteilungen stammen, insbesondere für Verteilungen, die nicht normal sind.

https://en.wikipedia.org/wiki/Robust_statistics

Rob Ustinov
quelle