Wozu deskriptive Statistiken melden?

21

Ich habe gerade eine Analyse meiner Daten mit Hilfe der logistischen Regression durchgeführt. Allerdings muss mein Bericht auch einen beschreibenden statistischen Teil enthalten. Ich verstehe das ehrlich gesagt nicht und ich hatte gehofft, dass jemand erklären kann, warum es notwendig ist.

Wenn ich zum Beispiel ein Histogramm einer meiner unabhängigen stetigen Variablen zeichne und es die Normalität oder die Schiefe anzeigt, wie kann dies dem Bericht einen Wert hinzufügen?

Meine Daten bestehen aus einer abhängigen Variablen, die wahr oder falsch ist, um eine Stelle zu bekommen, und die unabhängige Variable besteht aus Noten in der Mittelfrist, Noten in den Abschlussprüfungen und Männern oder Frauen.

user3223190
quelle
Wenn Sie beim Zeichnen eines Histogramms Ihrer Infusionen keinen Wert sehen, sollten Sie dies möglicherweise nicht tun. Sind jedoch Daten vorhanden, die Sie gesammelt haben und die Ihrer Meinung nach für die Arbeit, in der Sie präsentieren, von Nutzen sind? der Bericht?
Ian_Fin
Hallo Ian, ich habe ein paar Details zu meinem Problem hinzugefügt. Ich bin ziemlich neu in der Statistik und habe mich nur gefragt, ob es einen allgemeinen Ansatz gibt, den wir verfolgen, bevor wir eine logistische Regression durchführen.
User3223190
Ich schlage vor, auch verschiedene Darstellungen der Daten zu betrachten und möglicherweise einzuschließen. Zum Beispiel könnten Sie die Abschlussnote gegen die Halbzeitnote grafisch darstellen, die nach Geschlecht und Symbol nach "Arbeit bekommen" und "Arbeit nicht bekommen" farbcodiert ist.
Emil M Friedman

Antworten:

42

In meinem Bereich ist der beschreibende Teil des Berichts äußerst wichtig, da er den Kontext für die Generalisierbarkeit der Ergebnisse festlegt. Beispielsweise möchte ein Forscher die Prädiktoren für traumatische Hirnverletzungen nach Motorradunfällen in einer Stichprobe aus einem Krankenhaus identifizieren. Ihre abhängige Variable ist binär und sie hatte eine Reihe unabhängiger Variablen. Die multivariable logistische Regression ermöglichte es ihr, die folgenden Ergebnisse zu erzielen:

  • Kein Helmgebrauch angepasst ODER = 4,5 (95% CI 3,6, 5,5) im Vergleich zum Helmgebrauch.
  • Alle anderen Variablen wurden im endgültigen Modell nicht berücksichtigt.

Um klar zu sein, gab es keine Probleme mit der Modellierung. Wir konzentrieren uns auf den Wert, den die beschreibende Statistik hinzufügen kann.

Ohne die deskriptive Statistik kann ein Leser diese Ergebnisse nicht relativieren. Warum? Lassen Sie mich Ihnen die beschreibende Statistik zeigen:

age, years, mean (SD)                  54 (2)
males, freq (%)                       490 (98)
blood alcohol level, %, mean (SD)    0.10 (0.01)
...

Wie Sie oben sehen können, bestand ihre Stichprobe aus älteren, berauschten Männern. Mit diesen Informationen kann der Leser sagen, was, wenn überhaupt, diese Ergebnisse über Verletzungen bei jungen Männern oder Verletzungen bei nicht berauschten Fahrern oder bei weiblichen Fahrern aussagen können.

Bitte ignorieren Sie keine beschreibenden Statistiken.


quelle
5
Nettes Beispiel. Ist es echt oder erfunden?
Amöbe sagt Reinstate Monica
5
Danke, @amoeba. Die Zahlen und Statistiken sind real. Allerdings habe ich das Thema in traumatische Hirnverletzung geändert, um die Unschuldigen zu schützen.
3
Betrunkene Männer, die ohne Helm Motorrad fahren ... Wer hätte gedacht, dass Sie sich eine traumatische Hirnverletzung zuziehen könnten?
gung - Wiedereinsetzung von Monica
Ich genieße zu der Zeit ein Glas schönes australisches Rot und Bob ist dein Onkel ...
25

Der Zweck der Bereitstellung deskriptiver Statistiken besteht darin, Ihre Stichprobe so zu charakterisieren, dass Personen in anderen Zentren oder Ländern beurteilen können, ob sich Ihre Ergebnisse auf ihre Situation verallgemeinern lassen. In Ihrem Fall wäre eine Aufschlüsselung des Geschlechts, der Noten usw. eine nützliche Ergänzung zur logistischen Regression. Es ist nicht so, dass die Leute Ihre Annahmen überprüfen können, obwohl sie vielleicht auch versuchen, dies zu tun.

============== Bearbeiten, um Links zu einigen Richtlinien für den Gesundheitszustand zu erstellen

In dem mir vertrauten Bereich Gesundheit gibt es spezielle Richtlinien für die Berichterstattung. Diese wurden im EQUATOR-Netzwerk zusammengefasst und sollten für aktuelle Details konsultiert werden.

Als Beispiel können wir klinische Studien durchführen, bei denen die relevante Richtlinie CONSORT ist. In dem Dokument mit den hier und an anderer Stelle verfügbaren Leitlinien lesen wir in Tabelle 1 die Empfehlung 15 "Eine Tabelle mit demografischen und klinischen Basismerkmalen für jede Gruppe".

Es gibt ähnliche Empfehlungen für andere Studientypen.

mdewey
quelle
Vielen Dank, mdewey. Wenn wir also die verschiedenen beschreibenden Darstellungen machen und Normalität oder Schiefe bemerken, warum kommentieren wir sie dann nur. Die deskriptiven Statistiken dienen also im Grunde genommen nur dazu, den Leser darüber zu informieren, mit welchen Daten Sie arbeiten. Wirklich leid, wenn dies elementar erscheinen mag
User3223190
So funktioniert es im Gesundheitsbereich, mit dem ich am besten vertraut bin.
mdewey
8
+1. Zuerst habe ich "in anderen Zentren oder Ländern" als "in anderen Jahrhunderten" falsch verstanden.
Amöbe sagt Reinstate Monica
4

Eine andere Sache ist zu zeigen, wie gut sich Ihre Variablen verhalten. Wenn zum Beispiel eine Ihrer Variablen das Gehalt ist und Sie genau einen Milliardär befragt haben, wird bei der Eingabe seines Gehalts in die logistische Regression alles andere dominieren, sodass Sie wahrscheinlich lernen werden, das Gehalt unabhängig davon zu ignorieren Wie viele aktuelle Informationen kann es enthalten.

Einige Methoden reagieren empfindlicher auf Schräglage und Extremwerte als andere, und die logistische Regression ist eher empfindlich. Der letzte Beweis liegt natürlich im Pudding, und Sie können die erhaltenen Ergebnisse mit den Rohdaten oder mit jedem Merkmal vergleichen, das in Richtung Normalität transformiert wurde.

Davidmh
quelle
1

Ein beschreibender Teil hilft dem Leser, Ihren Datensatz zu verstehen. In der angewandten Wirtschaft wird es normalerweise dringend empfohlen, da es die ersten potenziellen Mängel in Ihrer Analyse aufzeigt.

Sie können Daten aus verschiedenen Quellen verwenden, um Ihre Beschreibungen in die Luft zu jagen.

1 Tisch sollte reichen. Der, den Sie angehängt haben, ist nicht sehr intuitiv.

Bonsaibubble
quelle