Kann mir jemand helfen zu verstehen, um welche Art von Problem es sich handelt? Ich bin mir nicht sicher, ob dies als Hypothesentest eingestuft wird

8

Bitte entschuldigen Sie, wenn diese Frage nicht klar ist. Ich bin mir nicht sicher, ob ich die richtigen Terminologien verwende.

Ich habe mehrmals ein Experiment in verschiedenen Umgebungen durchgeführt. Meine Daten sehen also ungefähr so ​​aus:

Environment1  1.2  2.1  1.1  1.5  1.6
Environment2  4.2  2.6  3.5  2.5  2.9
Environment3  7.2  4.6  5.3  4.5  1.6
Environment4  0.0  0.0  1.2  15.0 0.0
Environment5  3.2  2.4  7.2  5.5  6.6
Environment6  23.2  32.1  18.1  1.5  19.6

Ich kann deutlich sehen (oder vielleicht sagt meine Intuition), dass das Experiment in Umgebung4 (zu niedrig und stark schwankend) und Umgebung5 (viel zu hoch) nicht richtig durchgeführt wurde, bin mir aber nicht sicher, wie ich dies beweisen soll. Soll ich mich auf Hypothesentests mit der Hypothese verlassen:

Das Experiment wurde in den Umgebungen 4 und 6 nicht ordnungsgemäß durchgeführt.

und dann ein Verfahren anwenden, um dies zu beweisen? Oder gibt es eine Standardmethode, um dies zu zeigen? Kann mir bitte jemand helfen, wie ich mit solchen Problemen umgehen kann? Ich benutze R.

Legende
quelle
Schöne Frage, es ist ein gutes Beispiel, um sich verschiedenen Verfahren auszusetzen, da wir grundsätzlich ohne Mathematik oder Formalitäten wissen, dass sich Umgebung 4 und 6 von den anderen unterscheiden (und Umgebung 1 sich ein wenig von 2, 3 und 5 unterscheidet). Daher sollte jedes gute Verfahren in der Lage sein, das offensichtliche Ergebnis zu erzielen. Der einzige Unterschied besteht darin, zu quantifizieren, wie unterschiedlich es im mathematischen Sinne ist. Die offensichtliche Frage lautet: "Gibt es eine andere Möglichkeit, wie das Experiment diese Ergebnisse tatsächlich hätte liefern können, außer einem Fehler?"
Wahrscheinlichkeitslogik
@probabilityislogic: Danke. Was Sie sagen, ist nützlich: Wenn ich die Wirksamkeit des Experiments in jeder Umgebung irgendwie quantifizieren kann, kann ich vielleicht etwas sagen, bin mir aber immer noch nicht sicher, was ich sagen soll oder wie ich sagen soll. Ah .. (... ich fühle mich dumm, wenn ich Rätsel schreibe) :) In Bezug auf Ihre Frage: Das Experiment war ziemlich kontrolliert in dem Sinne, dass sichergestellt wurde, dass sich die Umgebung nicht verändert. Das Verfahren hätte jedoch schief gehen können. Möglicherweise wurde die Prozedur nicht ordnungsgemäß gemäß den Richtlinien ausgeführt (vielleicht?)
Legende
Ich spreche eher nach dem Motto " Ist eine physikalisch bedeutsame Größe? Was würde in der realen Welt passieren, wenn dies korrekt wäre?". Es kann auch nützlich sein, mit jemandem zu sprechen, der das Experiment 4 oder 6 tatsächlich durchgeführt hat (vorzugsweise mit der Person, die die Daten aufgezeichnet hat). 32.1
Wahrscheinlichkeitslogik
@probabilityislogic: Ich verstehe. Ich verstehe was sie meinen. Die Daten sind eine Antwortzeitvariable. Meine Meinung zu Ihrer Frage wäre, dass der Wert in einer physischen Welt zwar Sinn macht, aber einfach zu ungewöhnlich genug ist, um als seltener Fall bezeichnet zu werden. Die Person, mit der ich gesprochen habe, sagte, er habe nichts anders gemacht. Tatsächlich sind die Daten, die ich hier eingefügt habe, nur ein Beispiel aus den gesamten Daten, und es gibt einige Fälle wie diesen, die hier und da verbreitet sind.
Legende
Es scheint also, dass das wahrscheinlichste Ergebnis ein Fehler ist, aber interessante Entdeckungen können gemacht werden, wenn Sie sozusagen "tiefer graben". Könnte möglicherweise eine neue Entdeckung sein! aber sei nicht zu aufgeregt, es ist wahrscheinlich nichts, aber es kann sich lohnen, die Möglichkeit in Betracht zu ziehen und zu sehen, wohin es dich führt.
Wahrscheinlichkeitslogik

Antworten:

2

Sie können einen Schülertest durchführen, um festzustellen, ob der Mittelwert zwischen der Gruppe 4,6 und dem Rest unterschiedlich ist. Selbst wenn Ihre Stichprobengröße klein ist, werden Sie einen Unterschied feststellen. Beachten Sie, dass es Ihnen sagt, dass sich Gruppe 4,6 im Durchschnitt signifikant von den anderen unterscheidet, aber es wird Ihnen nicht sagen, dass "Das Experiment wurde in den Umgebungen 4 und 6 nicht ordnungsgemäß durchgeführt", was ohne Wissen von nicht beantwortet werden kann was "richtig" in den Beobachtungen bedeutet.

Robin Girard
quelle
girad: Eigentlich kam diese Frage von jemandem aus dem Testteam. Richtig bedeutet, dass sie eine Reihe von Anweisungen erhalten haben, die ausgeführt werden müssen, um einen endgültigen Wert zu erhalten. Das Experiment wird auch dann abgeschlossen, wenn eine der Anweisungen übersprungen wird, führt jedoch zu einer falschen Beobachtung. Ich werde das überprüfen, student testwas Sie erwähnt haben. Wenn sich der Test jedoch auf den Mittelwert stützt, sollte der Mittelwert aufgrund seiner Empfindlichkeit gegenüber Änderungen der Datenwerte kein schlechtes Maß sein? Vielen Dank für Ihre Zeit.
Legende
@Legend Ein Test der Mittelwertdifferenz mag unangemessen sein, aber das ist nicht die Schuld von @robin, wie in der zweiten Hälfte seiner Antwort ausgeführt, die zutreffend ist: Der zu verwendende Test wird durch welches Merkmal einer Suite von bestimmt Ergebnisse signalisieren ein "falsches" Experiment. Sie können einen F-Test für einen Unterschied der Standardabweichungen durchführen. Sie könnten mehrere Ausreißertests durchführen. Sie könnten einen Kruskal-Wallis-Test durchführen; usw., je nachdem, nach welchen Unterschieden Sie suchen.
whuber
@Legend Es gibt noch eine andere Schwierigkeit, die von Ihrer Frage überschattet wird, da Sie hier vermutet haben, dass 4,6 die verschiedenen Stichproben waren. Aber was ist, wenn Sie es nicht im Voraus wissen? Sie müssen alle Konfigurationen testen und wahrscheinlich ein Kriterium für mehrere Hypothesen einführen. In diesem Fall sieht es so aus, als würden Ausreißer erkannt, und viele Fragen haben sich hier bereits damit befasst.
Robin Girard
@whuber: Ich wollte nicht sehen, dass es jemandes Schuld ist. Ich bin ein Neuling hier, also entschuldige ich mich, wenn es so klingt. @robin girard: Das ist eine sehr interessante Einstellung. Vielen Dank. Ich habe nur über die Erkennung von Ausreißern nachgedacht. Können Sie mich auf ein relevantes Material für diesen speziellen Fall hinweisen? Alles, was ich zuvor verwendet habe, sind einfache wie k-means usw.
Legende