Ich bin verwirrt zwischen den beiden Begriffen "Wahrscheinlichkeitsfunktion" und "Momentenfunktion". Wie unterscheiden sich diese
Ich bin verwirrt zwischen den beiden Begriffen "Wahrscheinlichkeitsfunktion" und "Momentenfunktion". Wie unterscheiden sich diese
Das Halmos-Savage-Theorem besagt, dass für ein dominiertes statistisches Modell eine Statistik ist ausreichend, wenn (und nur wenn) für alle eine messbare Version des Radon-Nikodym-Derivats vorliegt, wobei ist bevorzugte Maßnahme, daß für und .( Ω , A , P ) (Ω,A,P)(\Omega, \mathscr A, \mathscr P)T...
Ich habe Probleme beim Verstehen der vollständigen und ausreichenden Statistiken. Sei eine ausreichende Statistik.T=ΣxiT=ΣxiT=\Sigma x_i Wenn für eine Funktion mit der Wahrscheinlichkeit 1 ist , dann ist dies eine vollständig ausreichende Statistik.E[g(T)]=0E[g(T)]=0E[g(T)]=0ggg Aber was heißt das?...
In " Convolutional Deep Believe Networks für skalierbares unbeaufsichtigtes Lernen hierarchischer Repräsentationen " von Lee et. al. ( PDF ) Faltungs-DBNs werden vorgeschlagen. Auch das Verfahren wird zur Bildklassifizierung ausgewertet. Dies klingt logisch, da es natürliche lokale Bildmerkmale wie...
Ich nehme derzeit am Kurs Eine Einführung in das Betriebsmanagement in Coursera.org teil. Irgendwann im Kurs begann der Professor, sich mit Variationen in der Operationszeit zu befassen. Die Messung, die er verwendet, ist der Variationskoeffizient , das Verhältnis zwischen der Standardabweichung...
Für Nicht-Statistiker wie mich ist es sehr schwierig, die Idee der VIMetrik (Variation von Informationen) zu erfassen, selbst nachdem sie das relevante Papier von Marina Melia " Vergleich von Clustern - Eine informationsbasierte Distanz " (Journal of Multivariate Analysis, 2007) gelesen hat ....
Kann jemand eine Vorstellung davon geben, warum die höheren Momente einer Wahrscheinlichkeitsverteilung p(x)wie der dritte und vierte Moment Schiefe bzw. Kurtosis entsprechen? Warum führt die Abweichung vom Mittelwert zur 3. oder 4. Potenz zu einem Maß für Schiefe und Kurtosis? Gibt es eine...
Die Idee hinter Recurrent Neural Network (RNN) ist mir klar. Ich verstehe es folgendermaßen: Wir haben eine Folge von Beobachtungen ( Ö⃗ 1, o⃗ 2, … , O.⃗ no→1,o→2,…,o→n\vec o_1, \vec o_2, \dots, \vec o_n ) (oder mit anderen Worten multivariate Zeitreihen). Jede einzelne Beobachtung Ö⃗ icho→i\vec...
Das mgcvPaket für Rhat zwei Funktionen zum Anpassen von Tensorproduktwechselwirkungen: te()und ti(). Ich verstehe die grundlegende Arbeitsteilung zwischen den beiden (Anpassen einer nichtlinearen Wechselwirkung vs. Zerlegen dieser Wechselwirkung in Haupteffekte und eine Wechselwirkung). Was ich...
Warum nehmen p-Werte und ks-Teststatistiken mit zunehmender Stichprobengröße ab? Nehmen Sie diesen Python-Code als Beispiel: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0,...
Das weiß ich aus früheren Studien V.a r ( A + B ) = V.a r ( A ) + V.a r ( B ) + 2 C.o v ( A , B )Var(A+B)=Var(A)+Var(B)+2Cov(A,B)Var(A+B) = Var(A) + Var(B) + 2 Cov (A,B) Ich verstehe jedoch nicht, warum das so ist. Ich kann sehen, dass der Effekt darin besteht, die Varianz zu "erhöhen", wenn A...
In dem Lehrbuch, das ich lese, verwenden sie positive Bestimmtheit (halbpositive Bestimmtheit), um zwei Kovarianzmatrizen zu vergleichen. Die Idee ist, dass wenn pd ist, kleiner als . Aber ich kämpfe darum, die Intuition dieser Beziehung zu bekommen?A−BA−BA-BBBBAAA Hier gibt es einen ähnlichen...
In einem Problemsatz habe ich dieses "Lemma" bewiesen, dessen Ergebnis für mich nicht intuitiv ist. ist eine Standardnormalverteilung in einem zensierten Modell.ZZZ Formal ist und . Dann Es besteht also eine Verbindung zwischen der Erwartungsformel über einer abgeschnittenen Domäne und der...
Die geschlossene Form von w in der linearen Regression kann wie folgt geschrieben werden w^=(XTX)−1XTyw^=(XTX)−1XTy\hat{w}=(X^TX)^{-1}X^Ty Wie können wir die Rolle von in dieser Gleichung intuitiv erklären
Kann jemand bitte eine einfache (Laien-) Erklärung der Beziehung zwischen Pareto-Verteilungen und dem zentralen Grenzwertsatz geben (z. B. gilt sie? Warum / warum nicht?)? Ich versuche die folgende Aussage zu verstehen: "Der zentrale Grenzwertsatz funktioniert nicht mit jeder Verteilung. Dies liegt...
Ich habe versucht, eine numerische Schätzung der Kullback-Leibler-Divergenz für zwei Stichproben zu implementieren. Um die Implementierung zu debuggen, ziehen Sie die Stichproben aus zwei Normalverteilungen und N ( 1 , 2 ) .N.( 0 , 1 )N(0,1)\mathcal N (0,1)N.( 1 , 2 )N(1,2)\mathcal N (1,2) Für eine...
Ich verstehe die Mechanik der Gewichte der Berechnung der Neigung unter Verwendung von Partituren : und dann Anwenden der Gewichte in einer Regressionsanalyse, zu der die Gewichte dienen "Kontrolle für" oder Trennung der Wirkungen von Kovariaten in den Populationen der Behandlungs- und...
Der Standardfehler eines Anteils ist der größte, den er für ein gegebenes N haben kann, wenn der fragliche Anteil 0,5 beträgt, und wird kleiner, je weiter der Anteil von 0,5 entfernt ist. Ich kann sehen, warum dies so ist, wenn ich die Gleichung für den Standardfehler eines Anteils betrachte, aber...
Trotz mehrerer Versuche, über Bootstrapping zu lesen, scheine ich immer gegen eine Mauer zu stoßen. Ich frage mich, ob jemand eine einigermaßen nicht-technische Definition von Bootstrapping geben kann. Ich weiß, dass es in diesem Forum nicht möglich ist, genügend Details bereitzustellen, damit ich...
Diese Frage hat hier bereits Antworten : Welche Art von Informationen sind Fisher-Informationen? (3 Antworten) Geschlossen vor 6 Monaten . Wikipedia sagt uns, dass die Partitur eine wichtige Rolle bei der Cramér-Rao-Ungleichung spielt. Es formuliert auch die Definition: