Ich bin auf ein neues Papier der Berkeley NLP-Gruppe über statistische Tests gestoßen, eine empirische Untersuchung der statistischen Signifikanz in NLP .
Es gibt einen Pseudocode zum Berechnen eines p-Werts in der Arbeit. Grundsätzlich besteht die Idee darin, dass der Abtastsatz von werden mit Ersetzung aus Daten abgetastet . Dann
, wobei eine metrische Verstärkung ist.
Ich konnte die Formel zur Berechnung des p-Werts in Koehns Arbeit Statistische Signifikanztests für die Bewertung der maschinellen Übersetzung verstehen , in der:
, wobei und die metrische Verstärkung für System bzw. sind.
Gibt es irgendeine Erklärung oder Referenz für die Formel . Die Autoren auch darauf hingewiesen , dass , wenn der Mittelwert von ist und symmetrisch ist, dann über beiden Formeln sind äquivalent.
quelle