Wie beschreibt man Statistiken in einem Satz?

27

Als ich anfing, Statistiken zu lernen, schienen Verfahren wie der T-Test, die ANOVA, das Chi-Quadrat und die lineare Regression jeweils sehr unterschiedliche Wesen zu sein. Aber jetzt merke ich, dass diese Prozeduren mehr oder weniger dasselbe bewirken. Ebenso messen Werte wie Varianz, Residuen, Standardfehler und Mittelwert mehr oder weniger dasselbe.

Ich gehe also davon aus, dass alle diese Verfahren und Werte und tatsächlich alle Statistiken in nur einem einfachen Satz beschrieben werden können:

Was ist der erwartete Wert und was ist die Abweichung um diesen Wert?

Das erwartete Wort könnte durch eines dieser Wörter ersetzt werden: hypothetisch, vorhergesagt oder zentral.

Wie würden andere Leute Statistiken in einem Satz beschreiben?

Luciano
quelle
10
@Trynna Diese Beschreibung ist viel zu eng: Sie kennzeichnet nur die Punktschätzung. Es ist so, als würde man Mathematik als Addition und Multiplikation von Zahlen beschreiben - was durchaus die Perspektive von jemandem sein könnte, der in der Schule einige Jahre lang Rechnen studiert hat -, aber weit hinter dem zurückbleibt, was der Fachbereich umfasst.
whuber

Antworten:

26

Die Statistik liefert die Argumentation und Methoden zum Erzeugen und Verstehen von Daten.

American Statistical Association

whuber
quelle
+1 Ich habe versucht, einen Ausdruck zu finden, der dieser Vorstellung sehr nahe kommt. Ich hätte etwas hinzugefügt, um auf der Basis von Daten zu Schlussfolgerungen zu kommen, aber es ist nicht ganz so prägnant.
Glen_b -Reinstate Monica
3
@ Glen Man merkt, dass viel über diese Charakterisierung nachgedacht wurde. Ich mag es hier irgendwo auf unserer Seite zu haben. Das und eine ähnlich aussagekräftige Beschreibung des maschinellen Lernens sollten auf unseren Hilfeseiten stehen.
Whuber
2
Ich bin mir nicht sicher, ob ich mit dem Zitat einverstanden bin (obwohl es ein schönes Anliegen ist). Als Epidemiologe weiß ich, dass ich etwas über das Studiendesign und die Erstellung von Daten und kausalen Schlussfolgerungen weiß, was für viele der hervorragenden Statistiker in meiner Umgebung uninteressant ist. Tatsächlich stammte die phantasievolle kausale Folgerung für rekursive kausale Graphen aus drei Bereichen, die nicht als Statistik bezeichnet wurden (Epidemiologie, Informatik und Soziologie, wie ich es verstehe). Dies nicht im kriegerischen Geiste, sondern weil der zitierte Satz einen Großteil der Wissenschaft beschreibt und keine Statistiken per se festnagelt .
Alexis
3
In der ASA-Beschreibung geht es viel mehr um Statistik als eine Domäne menschlichen Wissens und menschlichen Handelns und nicht darum, wer ein "Statistiker" sein könnte. Bis zum Zweiten Weltkrieg waren professionelle Statistiker eine Seltenheit, aber das bedeutet nicht, dass Statistiken nicht im kommerziellen und akademischen Umfeld angewendet wurden. Ich denke nicht, dass eine gute Definition der Statistik auf das beschränkt sein könnte, was professionelle Statistiker tun.
Silverfish
1
@Alexis Vielleicht gibt es einige Schwierigkeiten mit dem Verständnis , das das Wort "Verstehen" impliziert, was die ASA-Definition in ihrer Kürze eher zweideutig lässt. Eine weiter gefasste Interpretation könnte zu umfassend sein. Wenn wir materielle physikalische oder soziale Interpretation und zugrunde liegende Mechanismen als Teil des "Verstehens" einbeziehen, dann geht es sicherlich über "bloße" Statistiken hinaus. Andererseits ist mir nicht klar, warum Rückschlüsse auf kausale oder sonstige Daten nicht in den Bereich wissenschaftlicher und statistischer Bestrebungen fallen können.
Silverfish
13

Die Statistik befasst sich grundsätzlich mit dem Verständnis der Struktur in Daten.

Bill Venables und Brian Ripley, erster Satz in Kapitel 1 der Modern Applied Statistics mit S

mark999
quelle
1
Dies ist eine interessante, wenn auch begrenzte Statistik. Die möglichen Unklarheiten sind aufschlussreich: Ein Informatiker würde "Struktur in Daten" auf nicht statistische Weise verstehen. (Venables und Ripley arbeiten an der Schnittstelle von Statistik und
Datenverarbeitung
@whuber ich stimme dir zu. Es gibt keine Anhaltspunkte dafür, dass V & R beabsichtigt hat, alle Statistiken in einem Satz zu beschreiben, aber seit ich es zum ersten Mal gelesen habe, habe ich es für eine nette Beschreibung gehalten. Ich interpretiere "Struktur in Daten" als "Merkmale der Population, aus der die Stichprobe entnommen wurde".
mark999
10

Die Statistik bietet die Gründe und Methoden für die Konvertierung von Daten in aussagekräftige Informationen.

IrishStat
quelle
8

In den Worten des verstorbenen Leo Breiman:

Die Ziele in der Statistik sind die Verwendung von Daten zur Vorhersage und zum Abrufen von Informationen über den zugrunde liegenden Datenmechanismus.

http://projecteuclid.org/euclid.ss/1009213726

Richard Border
quelle
5

Persönlich mag ich das folgende Zitat von Stephen Senn in Würfeln mit dem Tod. Chance, Risiko und Gesundheit (Cambridge University Press, 2003). Ich habe einen Satz (oder zwei) hervorgehoben, der, wie ich glaube, seinen Hauptpunkt zusammenfasst, obwohl der gesamte Absatz lesenswert ist.

Statistiken sind und Statistiken sind.
Statistik, Singular, im Gegensatz zur allgemeinen Wahrnehmung, handelt nicht wirklich von Tatsachen; Es geht darum, wie wir wissen oder vermuten oder glauben, dass etwas eine Tatsache ist. Weil das Wissen über Dinge das Zählen und Messen von Dingen beinhaltet, ist es wahr, dass die Statistik im Plural Teil des Interesses der Statistik im Singular ist, der Wissenschaft des quantitativen Denkens. Diese Wissenschaft hat viel mehr mit der Philosophie (insbesondere der Erkenntnistheorie) zu tun als mit der Buchhaltung. Statistiker sind angewandte Philosophen.Philosophen streiten darüber, wie viele Engel auf einem Nadelkopf tanzen können. Statistiker zählen sie. Zählen Sie, wie viele wahrscheinlich tanzen können.Wahrscheinlichkeit ist das Herz der Materie, das Herz aller Materie, wenn man den Quantenphysikern glauben kann. Für den Statistiker ist dies wahr, ob die Welt streng deterministisch ist, wie Einstein glaubte, oder ob es eine verbleibende unabdingbare Unbestimmtheit gibt. Wir können nichts mit Sicherheit vorhersagen, aber wir können vorhersagen, wie unsicher unsere Vorhersagen im Durchschnitt sein werden. Statistik ist die Wissenschaft, die uns sagt, wie.

chl
quelle
5

Statistik ist die Wissenschaft des Lernens aus Daten und des Messens, Steuerns und Kommunizierens von Unsicherheit.

Marie Davidian und Thomas Louis

Sie machen weiter:

; und liefert damit die Navigation, die für die Steuerung des wissenschaftlichen und gesellschaftlichen Fortschritts unabdingbar ist

Momo
quelle
Ich mag diese Definition, weil sie den Aspekt der "Ungewissheit" hervorhebt. Der zweite Teil ist schön, denn er besagt, dass Statistiken nicht nur für sich existieren, sondern in einem breiteren Kontext gesehen werden müssen. Um jedoch völlig zufrieden zu sein, würde ich das vielleicht mit dem ASA zusammenführen, um:
Momo,
1
Statistik als Wissenschaft des Lernens aus Daten und des Messens, Steuerns und Kommunizierens von Unsicherheit liefert die Argumentation und Methoden zum Erzeugen und Verstehen von Daten.
Momo
2

Statistik ist eine Sammlung von Methoden und Denkweisen, die Menschen helfen, aus verrauschten Informationen klare Schlussfolgerungen zu ziehen.

Michael Lew
quelle
2

Da wir keine gottähnliche, allwissende Kreatur sind, müssen wir mit Unsicherheit umgehen, und Statistik bietet Methoden, um diese Unsicherheit zu berücksichtigen und widerzuspiegeln.

elevendollar
quelle
2

Die Statistik ist ein Teilgebiet der Philosophie, das sich mit der folgenden Frage befasst: „Wie lernen wir aus Beobachtungen?“ unter Verwendung strenger mathematischer Konzepte.

Nur eine Randnotiz: Sie können einen Satz sehr lang machen. Es gibt ein Buch von B. Hrabal, das aus einem langen Satz besteht. Siehe: Tanzstunden für Fortgeschrittene im Alter

pes
quelle
2

Statistik ist sowohl die Wissenschaft der Unsicherheit als auch die Technologie, Informationen aus Daten zu extrahieren

David J. Hand

Momo
quelle
2

Statistik ist eine Reihe von logischen Prinzipien und mathematischen Methoden, um quantifizierte Informationen auf genaue und relevante Weise zusammenzufassen.

SQLServerSteve
quelle
1

In Meinen Eigenen Worten

Statistics is the science of what might be

Das ist eine Art Augenzwinkern .

MCP_infiltrator
quelle
1
Wenn Sie das erste Wort maskieren und die Leute bitten würden, die Lücke auszufüllen, wäre "Statistik" vermutlich nicht das erste, was sie sich einfallen lassen - und vielleicht auch nicht das zweite oder dritte. "Futurologie", "Spekulation", "Science Fiction" und vielleicht - wenn Sie Ihrer Absicht ein wenig näher kommen - "Vorhersage" und "Prognose" - wären wahrscheinlich beliebte Entscheidungen. Auch "Oneirology" und "Apotropaism" wären Möglichkeiten. :-)
whuber
1

Fisher ( 1922 ) äußerte sich zum Wesen der Statistik in folgendem Zitat (fett gedruckte Schrift, hinzugefügt von mir für das Erfordernis eines Satzes ):

Um zu einer eindeutigen Formulierung statistischer Probleme zu gelangen, muss die Aufgabe definiert werden, die sich der Statistiker selbst stellt: Kurz und in seiner konkretesten Form ist das Ziel statistischer Methoden die Reduzierung von Daten . Eine Datenmenge, die in der Regel von sich aus nicht in den Sinn kommt, soll durch relativ wenige Mengen ersetzt werden, die das Ganze angemessen darstellen oder mit anderen Worten möglichst viel, im Idealfall das Ganze enthalten sollen , der relevanten Informationen in den Originaldaten enthalten.

ekvall
quelle
0

Ein ergebnisorientierter (und daher nicht wirklich beschreibender ) Einzeiler wäre für mich

Statistik ist es, was die menschliche Welt bewegt, unabhängig davon, was dies für die Natur bedeutet.

Alecos Papadopoulos
quelle
3
Verwechseln Sie Statistik mit Politik? Oder vielleicht mit Liebe?
whuber
@whuber (+1) Nein. Beide treffen die meisten Entscheidungen auf der Grundlage von Statistiken, unabhängig davon, ob sie dies realisieren oder nicht.
Alecos Papadopoulos
2
Ich kann es jetzt in einem kommenden Film sehen, wenn der männliche Hauptdarsteller auf die Knie geht und vorschlägt: "Baby, du bist mein UMVUE, willst du mich heiraten?" :-) (Lass uns einen Schrumpfungsschätzer verwenden und unsere Koeffizienten zusammenführen ...)
whuber
@whuber (+2) ... das ist der Teil "Verstehe es nicht": das ist genau das, was die männliche Hauptrolle bedeutet , obwohl er die Sprache nicht benutzt! (Ich gebe zu, dass ich mich hier des philosophischen Imperialismus schuldig gemacht habe).
Alecos Papadopoulos
2
Ihr zutiefst respektabler kultureller Hintergrund (sofern Ihr Name und Ihr Standort darauf schließen lassen), der zumindest auf die frühen Sophisten zurückgeht, lässt Ihnen diesbezüglich einiges an Spielraum. :-)
Whuber
0

Die Statistik ist ein Werkzeug zur Modellierung der Generierung von Daten durch unsichere und / oder probabilistische Prozesse.

thecity2
quelle
-1

In der Statistik geht es darum, Daten so lange zu quälen, bis sie gestehen, was Sie anzeigen möchten.

Ich paraphrasiere Ronald Coase, siehe Link

xeon
quelle
-1, war das als Augenzwinkern gedacht?
gung - Reinstate Monica
@gung ja und nein, ich zitierte Ronald Coase.
Vladislavs Dovgalecs
3
Gemessen an der hier vorliegenden Version handelt es sich bestenfalls um eine schlechte Paraphrase. Das ist keine gute 1-Satz-Zusammenfassung dessen, was Statistik ist.
gung - Reinstate Monica
3
@gung na ja, das OP fragte, wie verschiedene Leute es beschreiben würden. Es wird immer sein Standpunkt oder seine Meinung sein. Es wird für verschiedene Menschen unterschiedlich sein. OP versuchte, unterschiedliche Meinungen IMHO zu sammeln.
Vladislavs Dovgalecs
2
xeon Es wäre Coase eine große Freundlichkeit, Ihre Antwort zu bearbeiten, um die Zuschreibung korrekt zu zitieren und als Quelle zu verwenden.
Alexis
-2

Statistik ist die mathematische Wissenschaft, mit der Sie herausfinden können, ob der Unterschied zwischen Beobachtungssätzen nur zufällig ist oder nicht.

Sympa
quelle
1
Beschreibt eine enge Teilmenge dessen, was das Feld ist.
Rolando2
Ich sehe das anders. Unabhängig davon, ob Sie Hypothesentests, Regressionsmodelle oder andere Schätzungen durchführen, messen Sie meistens, ob der Unterschied zwischen Ihrer Schätzung und einem naiven Modell oder zwischen Beobachtungen statistisch signifikant ist oder nicht. Mein Satz erfasst das Wesentliche der statistischen Signifikanz gegenüber der Zufälligkeit. Wenn andere damit einverstanden sind, können Sie mir ein paar Gegenstimmen geben, sodass mein Kommentar, der leicht zu rechtfertigen ist, nicht nur aufgrund der subjektiven Interpretation der Enge durch eine Einzelperson als einfach falsche Antwort behandelt wird.
Sympa
2
Bitte überlegen Sie, welche Art von Fragen Sie häufig anhand von Statistiken beantworten möchten: Wie ist die Form dieser Verteilung? Welche Beziehung besteht zwischen diesen beiden Variablen? Wie können diese vielen Variablen gruppiert werden, damit wir die allgemeinen Probleme / Themen / Themen / Dimensionen sehen können? Wie können diese vielen Fälle gruppiert werden, damit wir die gängigen Typen / Profile sehen können? Wie lässt sich dieses Beziehungsgeflecht mit Blick auf die Kausalität am besten beschreiben? Was erfasst den zeitlichen Verlauf dieser Variablen? Wie lassen sich zukünftige Werte am besten prognostizieren?
Rolando2
In jedem dieser Fälle hat die Beantwortung dieser Fragen ein starkes Element von statistischer Signifikanz und zeigt sich, ob das, was Sie in irgendeiner Form betrachten, anders ist als das, was durch Zufälligkeit geschehen könnte. Für die meisten von uns bedeutet eine negative Abstimmung eine explizit falsche Antwort. Ich verstehe nicht, wie meine Antwort als solche eingestuft werden könnte.
Sympa
1
Der Schwebetext über dem Abwärtspfeil besagt, dass diese Antwort nicht nützlich ist. Ich finde es interessant - und daher nicht ungewöhnlich -, weil es zum Nachdenken anregt, aber ich habe es aus mehreren Gründen nicht bewertet. Das erste ist die Behauptung, dass Statistik eine "mathematische Wissenschaft" ist: Dies kommt dem Missverständnis (insbesondere bei bestimmten Mathematikern), dass Statistik nur ein Zweig der Mathematik ist, unangenehm nahe . Das zweite Problem ist, dass es nur das Testen von Hypothesen mit zwei Stichproben zu charakterisieren scheint, was ein sehr enger (wenn auch allgegenwärtiger) Teil der Statistik ist.
whuber