Ist nominal, ordinal und binär für quantitative Daten, qualitative Daten oder beides?

9

Ich beschäftige mich mit Datentypen und brauche Hilfe:

Geben Sie hier die Bildbeschreibung ein

Wenn Sie sich das Bild oben ansehen (von hier aus aufgenommen ), hat es folgende Datentypen:

  • Quantitativ (diskret, kontinuierlich)
  • Qualitativ (Nominal (N), Ordinal (O), Binär (B)).

Geben Sie hier die Bildbeschreibung ein

Aber wenn Sie sich dieses nächste Bild (von hier ) ansehen , sind die Kategorien:

  • Quantitativ (diskret (NOB))
  • Qualitativ

Ein Bild hat NOB unter Qualitativ, das andere hat es unter Quantitativ. Welches ist richtig?

Lehnen
quelle
5
Jede einzelne Kugel in der Beschreibung von "diskreten Daten" ist falsch und irreführend.
whuber

Antworten:

5

Diese Typologien können leicht so viel verwirren, wie sie erklären.

Zum Beispiel Binärdaten, wie in vielen Einführungstexten oder Kursen eingeführt, klingt sicherlich qualitativ: ja oder nein, überlebt oder gestorben, anwesend oder abwesend, männlich oder weiblich, was auch immer. Aber bewerten Sie die beiden Möglichkeiten 1 oder 0 und alles ist dann perfekt quantitativ. Eine solche Bewertung ist die Grundlage aller Arten von Analysen: Der Anteil der Frauen ist nur der Durchschnitt von mehreren Nullen für Männer und Einsen für Frauen. Wenn ich auf 7 Frauen und 3 Männer treffe, kann ich nur 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 mitteln, um den Anteil 0,7 zu ​​erhalten. Mit binären Antworten haben Sie dann einen weiten Weg frei, um die Regression zu protokollieren und zu testen usw., die sich auf die Variation des Anteils, des Bruchteils oder der Wahrscheinlichkeit, die überlebt hat, oder auf etwas Ähnliches konzentrieren, mit was auch immer es sonst kontrolliert oder beeinflusst. Niemand muss sich Sorgen machen, dass die Codierung willkürlich ist. Der Anteil männlich ist nur 1 minus dem Anteil weiblich,

Fast das Gleiche gilt, wenn nominale oder ordinale Daten berücksichtigt werden, da jede Analyse solcher Daten davon abhängt , wie viele in jede Kategorie fallen und Sie dann so quantitativ sein können, wie Sie möchten. Kreisdiagramme und Balkendiagramme, wie sie zum ersten Mal in frühen Jahren angetroffen wurden, zeigen dies. Es ist daher rätselhaft, wie viele Konten dies in Erklärungen übersehen.

Anders ausgedrückt, Sie können Roh- oder Originaldaten so klassifizieren, wie sie zuerst gemeldet wurden und beispielsweise in der Zelle einer Tabelle oder Datenbank angezeigt werden. Aber seine ursprüngliche Form ist nicht unveränderlich. Stellen Sie sich etwas Starkes vor, wie einen Tod durch Verwirrung, wenn Sie zu viele oberflächliche Lehrbücher lesen. Das kann auf ein Zertifikat geschrieben werden, aber die statistische Analyse hört hier nie auf. Es gibt eine Aggregation von Zählungen (wie viele solcher Todesfälle in einem Gebiet und einem Zeitraum), eine Reduzierung der Raten (wie viele im Verhältnis zur gefährdeten Bevölkerung) und so weiter.

Daher verhindert die Art und Weise, wie die Daten zuerst codiert werden, selten ihre Verwendung auf andere Weise und die Umwandlung in andere Formen. Die Etymologie der Daten ist hier aufschlussreich: Wenn Sie das ursprüngliche Latein wörtlich übersetzen, sind sie so, wie sie Ihnen gegeben wurden, aber es gibt keine Regel gegen die Konvertierung in viele andere Formen.

Nick Cox
quelle
5

Alles in allem konnte ich kein Bild finden, das alles zusammenfügt, also habe ich eines basierend auf dem, was ich studiert habe, gemacht. Es hat mich verwirrt, die Messskalen mit den Datentypen auf dasselbe Diagramm zu setzen, und ich habe versucht zu zeigen, dass es dort einen Unterschied gibt.

Geben Sie hier die Bildbeschreibung ein

Ich schätze Ihre Hilfe und Gedanken! Grüße, gelehnt

Lehnen
quelle
Diskrete quantitative Variablen (wie Zählungen) können auch mithilfe einer Intervall- oder Verhältnisskala gemessen werden! Siehe hier zum Beispiel.
Rodvi
3

Es kommt darauf an, was Sie unter "quantitativen Daten" und "qualitativen Daten" verstehen.

Ich denke, die beiden von Ihnen zitierten Websites verwenden die Begriffe unterschiedlich. Angenommen, Sie fragen zum Beispiel Leute:

Did you vote for Obama, Romney, someone else or no one in the presidential election?

Um welche Art von Daten handelt es sich? Die Variable ist nominal: Es sind nur Namen, es gibt keine Reihenfolge. Aber viele Leute würden es als quantitativ bezeichnen, denn der Schlüssel ist, wie viele sich für einen Kandidaten entscheiden. Dies steht im Gegensatz zu qualitativen Daten, bei denen es sich möglicherweise um Transkriptionen von Interviews handelt, die zeigen, was ihnen an Obama (oder Romney oder wem auch immer) am besten gefällt.

Eine bessere Sichtweise besteht darin, quantitative Daten klar von quantitativen Variablen zu unterscheiden.

Peter Flom
quelle
Im ersten Fall gibt es eine Variable, die den Namen des Präsidenten enthält. Die Variable ist qualitativ, genauer gesagt nominal. Im zweiten Fall entspricht jeder Präsidentenname einer individuellen Variablen, die die Wähler enthält. Wenn Wählernamen bekannt sind und Wählernamen enthalten, ist die Variable nominal. Wenn es die Anzahl der Stimmen hat, ist die Variable quantitativ, genauer gesagt in der Verhältnisskala.
Ioannis Iliadis - Ilousis
2

Keines dieser Diagramme ist korrekt. Sie sind eher unsinnig und Sie haben Recht, verwirrt zu sein (abgesehen vom Widerspruch).

Sie scheinen die Ideen des grundlegenden Variablentyps und der Variablenauswahl zu verbinden, um ein System (mit einem PDF) zu modellieren.

Es gibt 3 grundlegende Variablentypen (ohne Untertypen): Nominal (kategorial / qualitativ), Ordinal und Kontinuierlich (numerisch, quantitativ). Ordinal hat sowohl qualitativen als auch quantitativen Charakter.

Das Attribut ist kein wirklich grundlegender Typ, wird jedoch normalerweise auf diese Weise bei der Auswahl eines geeigneten Kontrolldiagramms erläutert, bei dem das beste PDF für die Modellierung des Systems ausgewählt wird. Dies wird manchmal als "Attributdaten" bezeichnet, aber der Typ ist nominal (auch bekannt als kategorial usw.). Wie Nick erwähnt hat, zählen wir Nominale, so dass es mit einem numerischen Typ verwechselt werden kann, aber es ist nicht.

Mandata
quelle
1
Mandata, basierend auf dem, was Sie sagen, welche Änderungen würden Sie an der Tabelle vornehmen, die ich oben vorgenommen habe? Ich schätze Ihre Hilfe. Grüße, lehnen
lehnen
Mandata, all diese Diagramme von verschiedenen Experten sind teilweise korrekt. Die Sache ist, dass die Menschen Wörter und Konzepte nicht vollständig identisch verstehen, aber es vorziehen, für einige lange oder kurze Zeit nach ihrem eigenen bequemen Verständnis zu stapeln. Zum Beispiel werden einige Leute es ablehnen, die Ordnungsskala als "quantitativ" zu bezeichnen, während andere akzeptieren, abhängig davon, ob "Quantität" notwendigerweise eine potenziell zugrunde liegende Kategorie des Seins ist.
ttnphns
@Leaning. Dieses Diagramm ist besser als Ihr letztes. Ich würde diskret eine Qualität des Typs betrachten, nicht einen Typ selbst. Nominal und geordnet sind völlig diskret, während zählbar (endlich oder unendlich) auch quantitativ ist. Binär ist auch ein Merkmal des Typs (es ist eine Teilmenge von diskret). Binär wird selten geordnet und fast immer durch nominelle Variablen dargestellt. Kategorial und nominal sind Synonyme. Der Unterschied zwischen geordneten Variablen ist kaum bedeutungslos, sie können teilweise oder vollständig unbekannt oder nicht relevant sein (letzteres impliziert Sinnlosigkeit), aber das würde ich nicht behaupten.
Mandata
@ttnphns, ich stimme dem zu, was Sie im Geiste sagen, aber beide haben schwerwiegende konzeptionelle Fehler. Der erste mischt die Idee des Attributdatentyps, der bei der Auswahl eines Kontrolldiagramms verwendet wird, welcher Basisdatentyp. Die zweite hat nominal als Teilmenge von diskret, was eine Teilmenge von stetig ist. Ich könnte diskret unterteilen, aber nominal gehört unter qualitativ. Vielleicht ist es da, weil man nominelle Ereignisse diskret zählt, aber selbst wenn es deshalb falsch ist.
Mandata
Ich glaube nicht, dass die Intervall- / Verhältnis-Theorie eine gültige Methode zur Beschreibung des Variablentyps ist. Es könnte gut sein, um festzustellen, welche Funktionen sinnvoll sind, wenn man sich in Bezug auf die Mathematik nicht sicher ist, aber darüber hinaus sehe ich eine Skala als Transformation einer anderen Skala, wenn sie dieselben Dimensionen oder Einheiten darstellen.
Mandata
1

Ich habe diese Frage bei der Suche nach Messwerten und verwandten Konzepten gefunden. Ich denke, den Diagrammen in der Frage fehlt der Kontext. Bei der Kategorisierung definieren wir die Regeln für die Gruppierung der Objekte nach unserem Zweck. Was ist der Zweck? Und sprechen wir über die Variablen?

Wir könnten Variablen nach den Messebenen kategorisieren , dann könnten wir 4 Skalen (Gruppen) mit den folgenden Regeln haben:

nominal : Attribute einer Variablen werden nur nach Name (Kategorie) unterschieden und es gibt keine Reihenfolge (Rang, Position).
Ordnungszahl : Attribute einer Variablen werden nach Reihenfolge (Rang, Position) unterschieden, aber wir kennen den relativen Grad der Differenz zwischen ihnen nicht.
Intervall : Attribute einer Variablen werden durch den Grad der Differenz zwischen ihnen unterschieden, es gibt jedoch keinen absoluten Nullpunkt, und das Verhältnis zwischen den Attributen ist unbekannt.
Verhältnis : Attribute einer Variablen werden durch den Grad der Differenz zwischen ihnen unterschieden, es gibt einen absoluten Nullpunkt und wir könnten das Verhältnis zwischen den Attributen finden.

Und dies ist nur ein Ansatz von Stanley Smith Stevens. Es gibt mehrere andere Typologien.

Kontinuierliche und diskrete Variablen sind mathematische Konzepte, bei denen wir eine Reihe von reellen Zahlen haben und:

Die kontinuierliche Variable kann einen beliebigen Wert in diesem Bereich annehmen. Die Anzahl der zulässigen Werte ist unzählig.
während für diskrete Variablen die Anzahl der zulässigen Werte im Bereich entweder endlich oder zählbar unendlich ist.

Wombatonfire
quelle