Ich habe eine Reihe von Daten, und . Ich möchte die folgende Hypothese testen: Es gibt einen Peak in ; das heißt, wenn zunimmt, nimmt zuerst zu und dann ab.y x y
Meine erste Idee war, und in eine Spiegelreflexkamera einzubauen. Das heißt, wenn ich finde, dass der Koeffizient vor signifikant positiv und der Koeffizient vor signifikant negativ ist, dann habe ich Unterstützung für die Hypothese. Dies überprüft jedoch nur einen Beziehungstyp (quadratisch) und erfasst möglicherweise nicht unbedingt die Existenz des Peaks.x 2 x x 2
Dann dachte ich daran, ,solcher Bereich von (geordnet Werte) x , daß b zwischen a und c zwei anderen Regionen von x , die mindestens so viele Punkte wie enthalten b und daß ¯ y b > ¯ y a und ¯ y b > ¯ y c deutlich. Wenn die Hypothese wahr ist, sollten wir viele solcher Regionen erwarten b . Wenn also die Anzahl von b ausreichend groß ist, sollte die Hypothese unterstützt werden.
Glauben Sie, ich bin auf dem richtigen Weg, um einen geeigneten Test für meine Hypothese zu finden? Oder erfinde ich das Rad und es gibt eine etablierte Methode für dieses Problem? Ich werde Ihren Beitrag sehr schätzen.
AKTUALISIEREN. Meine abhängige Variable ist count (nicht negative ganze Zahl).
quelle
Antworten:
Ich dachte auch an die Glättungsidee. Es gibt jedoch einen ganzen Bereich, der als Antwortoberflächenmethode bezeichnet wird und bei dem nach Peaks in verrauschten Daten gesucht wird (dabei werden in erster Linie lokale quadratische Anpassungen an die Daten verwendet), und es gab ein berühmtes Papier, an das ich mich mit "Bump Hunting" im Titel erinnere. Hier sind einige Links zu Büchern über die Methodik der Antwortoberflächen. Ray Myers Bücher sind besonders gut geschrieben. Ich werde versuchen, das Beulenjagdpapier zu finden.
Response Surface Methodology: Prozess- und Produktoptimierung mit Hilfe von Designed Experiments
Antwortoberflächenmethodik und verwandte Themen
Antwortoberflächen-Methodik
Empirische Modellbildung und Reaktionsflächen
Obwohl nicht der Artikel, den ich gesucht habe, ist hier ein sehr relevanter Artikel von Jerry Friedman und Nick Fisher, der sich mit diesen Ideen befasst, die auf hochdimensionale Daten angewendet werden.
Hier ist ein Artikel mit einigen Online-Kommentaren.
Ich hoffe, Sie wissen meine Antwort zumindest zu schätzen. Ich denke, Ihre Ideen sind gut und auf dem richtigen Weg, aber ich glaube, Sie erfinden das Rad möglicherweise neu, und ich hoffe, Sie und andere werden sich diese hervorragenden Referenzen ansehen.
quelle
Auch wenn Sie meine Frage nicht beantwortet haben, suchen Sie nach einem Test für weißes Rauschen, der im Frequenzbereich liegt, um zu zeigen, dass das Spektrum flach ist. Es könnte also ein Fisher-Periodogrammtest verwendet werden, der in dieser Literaturstelle als Fisher-Kappa bezeichnet wird. Siehe den Link.
http://www4.stat.ncsu.edu/~dickey/Spain/pdf_Notes/Spectral2.pdf
Bartletts Test wird auch in der Referenz erwähnt. Das Ablehnen der Nullhypothese läuft darauf hinaus, einen signifikanten Peak im Periodogramm zu finden. Dies würde bedeuten, dass in der Zeitreihe eine periodische Komponente vorhanden ist.
Da sich der Test im Frequenzbereich befindet und Periodogramm-Ordinaten umfasst, hat die Ordinate eine Chi-Quadrat-2-Verteilung unter der Nullhypothese und ist unabhängig. Diese spezielle Verteilung kommt nur durch die Transformation in den Frequenzbereich zustande. Wenn x Zeit wäre, würde dies im Zeitbereich nicht funktionieren, oder im Allgemeinen wäre die Verteilung für das ys kein unabhängiges Chi-Quadrat.
quelle