Wie auf dieser Wikipedia-Seite erläutert , sind zwei Zufallsvariablen X und Y statistisch unabhängig, wenn sie nicht korreliert und gemeinsam normalverteilt sind.
Ich weiß, wie man prüft, ob X und Y korreliert sind, habe aber keine Ahnung, wie man prüft, ob sie gemeinsam normalverteilt sind. Ich kenne kaum Statistiken (ich habe vor ein paar Wochen erfahren, was eine Normalverteilung ist), daher würden einige erklärende Antworten (und möglicherweise einige Links zu Tutorials) wirklich helfen.
Meine Frage lautet also: Wenn zwei Signale eine endliche Anzahl von N-mal abgetastet werden, wie kann ich überprüfen, ob die beiden Signalabtastungen gemeinsam normalverteilt sind?
Zum Beispiel: Die folgenden Bilder zeigen die geschätzte gemeinsame Verteilung von zwei Signalen, s1 und s2, wobei:
x=0.2:0.2:34;
s1 = x*sawtooth(x); %Sawtooth
s2 = randn(size(x,2)); %Gaussian
Das gemeinsame PDF wurde mit diesem 2D-Kernel-Dichteschätzer geschätzt .
Aus den Bildern ist leicht ersichtlich, dass das gemeinsame PDF eine hügelartige Form hat, die ungefähr am Ursprung zentriert ist. Ich glaube, dass dies ein Hinweis darauf ist, dass sie tatsächlich gemeinsam normal verteilt sind. Ich möchte jedoch eine Möglichkeit, dies mathematisch zu überprüfen. Gibt es eine Formel, die verwendet werden kann?
Vielen Dank.
s1 = randn(size(x,2));; s2 = randn(size(x,2));
??Antworten:
Abgesehen von der grafischen Prüfung können Sie einen Normalitätstest verwenden . Für bivariate Daten sind Mardias Tests eine gute Wahl. Sie quantifizieren die Form Ihrer Verteilungen auf zwei verschiedene Arten. Wenn die Form nicht normal aussieht, ergeben die Tests niedrige p-Werte.
Matlab-Implementierungen finden Sie hier .
quelle
Dies ist eher ein erweiterter Kommentar als ein Versuch, den spezifischen Vorschlag von @ MånsT zu verbessern: Statistische Tests sind im Großen und Ganzen keine Tests dafür, welche Verteilung Daten erzeugt hat, sondern welche NICHT. Es gibt einige Tests, die "abgestimmt" sind, um Antworten auf die Normalitätsfrage zu geben: Ist dies NICHT aus einer Normalverteilung. Der Kolmogorov-Smirnov-Test mit einer Stichprobe ist ziemlich bekannt. Der Anderson Darling-Test ist im One-D-Fall vielleicht leistungsfähiger. Sie sollten sich ernsthaft fragen, WARUM ist die Antwort wichtig? Oft stellen Leute die Frage für die falschen statistischen Zwecke. Ihr Beispiel hat gezeigt, dass Ihr Grafik-Augapfel-Test eine geringe Leistung gegenüber einer Alternative aufweist, die aus einer Sägezahn-Gauß-Alternative besteht. Sie haben jedoch nicht gezeigt, wie sich dieser Fehler auf Ihre zugrunde liegende Frage auswirkt.
quelle