Mein Verständnis war, dass deskriptive Statistiken Merkmale einer Datenprobe quantitativ beschreiben, während inferentielle Statistiken Rückschlüsse auf die Populationen zuließen, aus denen Proben entnommen wurden.
Auf der Wikipedia-Seite für statistische Rückschlüsse heißt es jedoch:
Die statistische Inferenz macht zum größten Teil Aussagen über Populationen, wobei Daten verwendet werden, die aus der Population von Interesse mittels einer Form von Zufallsstichprobe gezogen wurden.
Das "zum größten Teil" hat mich denken lassen, dass ich diese Konzepte vielleicht nicht richtig verstehe. Gibt es Beispiele für Inferenzstatistiken, die keine Aussagen über Populationen machen?
terminology
descriptive-statistics
inference
user1205901 - Setzen Sie Monica wieder ein
quelle
quelle
Antworten:
Ich komme aus den Verhaltenswissenschaften und verbinde diese Terminologie insbesondere mit einführenden Statistiklehrbüchern. In diesem Zusammenhang wird unterschieden zwischen:
Der wichtige Punkt ist, dass jede inferentielle oder beschreibende Statistik eine Funktion der Beispieldaten ist. Ein Parameter ist eine Funktion der Grundgesamtheit, wobei der Begriff Grundgesamtheit dem zugrunde liegenden Datenerzeugungsprozess entspricht.
Aus dieser Perspektive hängt der Status einer bestimmten Funktion der Daten als beschreibende oder ableitende Statistik von dem Zweck ab, für den Sie sie verwenden.
Allerdings sind einige Statistiken für die Beschreibung relevanter Merkmale der Daten eindeutig nützlicher, und andere eignen sich gut, um Rückschlüsse zu ermöglichen.
Aus dieser Perspektive sind folgende wichtige Dinge zu verstehen:
Sie können also entweder die Unterscheidung zwischen deskriptiv und inferenziell basierend auf der Absicht des Forschers definieren, indem Sie die Statistik verwenden, oder Sie können eine Statistik basierend auf ihrer typischen Verwendung definieren.
quelle
Eine Form der Folgerung basiert auf der zufälligen Zuordnung experimenteller Behandlungen und nicht auf der Zufallsauswahl aus einer Population (sogar hypothetisch). Oscar Kempthorne war ein Befürworter.
Vorhersage ist ein weiterer Bereich, in dem Sie nicht unbedingt Aussagen über Populationen formulieren. (Ich weiß nicht, dass jeder die Vorhersage "Inferenz" nennen möchte, aber es gibt Geisser (1993), Predictive Inference: An Introduction ). Oft folgt die Vorhersage aus einem angepassten Populationsmodell, aber nicht immer. ZB @ Matts Klassifizierungsbeispiel, Modellmittelung (Bayesian oder basierend auf Akaike-Gewichten) oder Vorhersage-Algorithmen wie Exponential-Glättung.
NB Ich denke, "Inferenzstatistik vs. deskriptive Statistik" bezieht sich häufiger auf die Disziplin Statistik als auf Mengen, die aus Stichproben berechnet wurden. Es gibt keinen wesentlichen Unterschied zwischen einer inferentiellen und einer deskriptiven Statistik. @ Jeremy hat darauf hingewiesen, es ist eine Frage, wozu Sie es verwenden.
quelle
Ich bin mir nicht sicher, ob die Klassifizierung unbedingt eine Aussage über die Population (en) macht, aus denen die Datenpunkte stammen. Wie Sie wahrscheinlich wissen, verwendet die Klassifizierung Trainingsdaten, die aus einigen "Merkmals" -Vektoren bestehen, die jeweils mit einer bestimmten Klasse gekennzeichnet sind, um die Klassenbezeichnungen vorherzusagen, die zu anderen nicht gekennzeichneten Merkmalsvektoren gehören. Zum Beispiel könnten wir die Vitalfunktionen eines Patienten und die Diagnose eines Arztes verwenden, um vorherzusagen, ob andere Patienten gesund oder krank sind.
Andere Klassifizierer suchen jedoch nach Unterschieden zwischen den Klassen, ohne die Klassen selbst zu modellieren. diese werden diskriminative Klassifikatoren genannt. Ein klassisches Beispiel ist der Klassifikator für den nächsten Nachbarn, der der Klasse seines nächsten Nachbarn ein unbeschriftetes Beispiel zuweist (wobei close auf eine für das Problem sinnvolle Weise definiert ist). Dies scheint nicht viel, wenn überhaupt, Informationen über die Populationen zu enthalten, aus denen die Datenpunkte gezogen wurden.
quelle
In einer Zeile versuchen beschreibende Statistiken angesichts der Daten, den Inhalt Ihrer Daten mit minimalem Informationsverlust zusammenzufassen (je nachdem, welche Maßnahme Sie verwenden). Sie können die Geografie der Daten sehen. (Sehen Sie sich etwa das Leistungsdiagramm der Klasse an und sagen Sie, wer oben, unten usw. ist.)
In einer Zeile versuchen Sie anhand der Daten, die Eigenschaften der hypothetischen Grundgesamtheit, aus der die Daten stammen, abzuschätzen und daraus zu schließen. (So etwas wie das Verstehen von Schülern der 7. Klasse anhand der guten Stichprobe aus der Klasse, vorausgesetzt, die zugrunde liegende Grundgesamtheit ist groß genug, dass Sie sie nicht in ihrer Gesamtheit berücksichtigen können.)
quelle
Zusamenfassend
Deskriptive Statistik ist die Analyse von Daten, die Daten aussagekräftig beschreiben, anzeigen oder zusammenfassen. Es ist einfach eine Möglichkeit, unsere Daten / Gespräche über die gesamte Bevölkerung zu beschreiben. Einige von ihnen sind Maß für die zentrale Tendenz und Maß für die Streuung
Inferenzstatistik ist eine Technik, die es uns ermöglicht, Stichproben zu verwenden, um Verallgemeinerungen über die Populationen vorzunehmen, aus denen die Stichproben entnommen wurden
quelle
Deskriptive Statistik ist die Analyse von Daten, die Daten aussagekräftig beschreiben, anzeigen oder zusammenfassen. Es ist einfach eine Möglichkeit, unsere Daten / Gespräche über die gesamte Bevölkerung zu beschreiben. Einige von ihnen sind Maße der zentralen Tendenz und Maß der Streuung
Inferenzstatistik ist eine Technik, die es uns ermöglicht, Stichproben zu verwenden, um Verallgemeinerungen über die Populationen vorzunehmen, aus denen die Stichproben gezogen wurden. Testen von Beispielhypothesen und Verbessern dieser Antwort
quelle