Ich beschäftige mich mit Datentypen und brauche Hilfe:
Wenn Sie sich das Bild oben ansehen (von hier aus aufgenommen ), hat es folgende Datentypen:
- Quantitativ (diskret, kontinuierlich)
- Qualitativ (Nominal (N), Ordinal (O), Binär (B)).
Aber wenn Sie sich dieses nächste Bild (von hier ) ansehen , sind die Kategorien:
- Quantitativ (diskret (NOB))
- Qualitativ
Ein Bild hat NOB unter Qualitativ, das andere hat es unter Quantitativ. Welches ist richtig?
Antworten:
Diese Typologien können leicht so viel verwirren, wie sie erklären.
Zum Beispiel Binärdaten, wie in vielen Einführungstexten oder Kursen eingeführt, klingt sicherlich qualitativ: ja oder nein, überlebt oder gestorben, anwesend oder abwesend, männlich oder weiblich, was auch immer. Aber bewerten Sie die beiden Möglichkeiten 1 oder 0 und alles ist dann perfekt quantitativ. Eine solche Bewertung ist die Grundlage aller Arten von Analysen: Der Anteil der Frauen ist nur der Durchschnitt von mehreren Nullen für Männer und Einsen für Frauen. Wenn ich auf 7 Frauen und 3 Männer treffe, kann ich nur 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 mitteln, um den Anteil 0,7 zu erhalten. Mit binären Antworten haben Sie dann einen weiten Weg frei, um die Regression zu protokollieren und zu testen usw., die sich auf die Variation des Anteils, des Bruchteils oder der Wahrscheinlichkeit, die überlebt hat, oder auf etwas Ähnliches konzentrieren, mit was auch immer es sonst kontrolliert oder beeinflusst. Niemand muss sich Sorgen machen, dass die Codierung willkürlich ist. Der Anteil männlich ist nur 1 minus dem Anteil weiblich,
Fast das Gleiche gilt, wenn nominale oder ordinale Daten berücksichtigt werden, da jede Analyse solcher Daten davon abhängt , wie viele in jede Kategorie fallen und Sie dann so quantitativ sein können, wie Sie möchten. Kreisdiagramme und Balkendiagramme, wie sie zum ersten Mal in frühen Jahren angetroffen wurden, zeigen dies. Es ist daher rätselhaft, wie viele Konten dies in Erklärungen übersehen.
Anders ausgedrückt, Sie können Roh- oder Originaldaten so klassifizieren, wie sie zuerst gemeldet wurden und beispielsweise in der Zelle einer Tabelle oder Datenbank angezeigt werden. Aber seine ursprüngliche Form ist nicht unveränderlich. Stellen Sie sich etwas Starkes vor, wie einen Tod durch Verwirrung, wenn Sie zu viele oberflächliche Lehrbücher lesen. Das kann auf ein Zertifikat geschrieben werden, aber die statistische Analyse hört hier nie auf. Es gibt eine Aggregation von Zählungen (wie viele solcher Todesfälle in einem Gebiet und einem Zeitraum), eine Reduzierung der Raten (wie viele im Verhältnis zur gefährdeten Bevölkerung) und so weiter.
Daher verhindert die Art und Weise, wie die Daten zuerst codiert werden, selten ihre Verwendung auf andere Weise und die Umwandlung in andere Formen. Die Etymologie der Daten ist hier aufschlussreich: Wenn Sie das ursprüngliche Latein wörtlich übersetzen, sind sie so, wie sie Ihnen gegeben wurden, aber es gibt keine Regel gegen die Konvertierung in viele andere Formen.
quelle
Alles in allem konnte ich kein Bild finden, das alles zusammenfügt, also habe ich eines basierend auf dem, was ich studiert habe, gemacht. Es hat mich verwirrt, die Messskalen mit den Datentypen auf dasselbe Diagramm zu setzen, und ich habe versucht zu zeigen, dass es dort einen Unterschied gibt.
Ich schätze Ihre Hilfe und Gedanken! Grüße, gelehnt
quelle
Es kommt darauf an, was Sie unter "quantitativen Daten" und "qualitativen Daten" verstehen.
Ich denke, die beiden von Ihnen zitierten Websites verwenden die Begriffe unterschiedlich. Angenommen, Sie fragen zum Beispiel Leute:
Um welche Art von Daten handelt es sich? Die Variable ist nominal: Es sind nur Namen, es gibt keine Reihenfolge. Aber viele Leute würden es als quantitativ bezeichnen, denn der Schlüssel ist, wie viele sich für einen Kandidaten entscheiden. Dies steht im Gegensatz zu qualitativen Daten, bei denen es sich möglicherweise um Transkriptionen von Interviews handelt, die zeigen, was ihnen an Obama (oder Romney oder wem auch immer) am besten gefällt.
Eine bessere Sichtweise besteht darin, quantitative Daten klar von quantitativen Variablen zu unterscheiden.
quelle
Keines dieser Diagramme ist korrekt. Sie sind eher unsinnig und Sie haben Recht, verwirrt zu sein (abgesehen vom Widerspruch).
Sie scheinen die Ideen des grundlegenden Variablentyps und der Variablenauswahl zu verbinden, um ein System (mit einem PDF) zu modellieren.
Es gibt 3 grundlegende Variablentypen (ohne Untertypen): Nominal (kategorial / qualitativ), Ordinal und Kontinuierlich (numerisch, quantitativ). Ordinal hat sowohl qualitativen als auch quantitativen Charakter.
Das Attribut ist kein wirklich grundlegender Typ, wird jedoch normalerweise auf diese Weise bei der Auswahl eines geeigneten Kontrolldiagramms erläutert, bei dem das beste PDF für die Modellierung des Systems ausgewählt wird. Dies wird manchmal als "Attributdaten" bezeichnet, aber der Typ ist nominal (auch bekannt als kategorial usw.). Wie Nick erwähnt hat, zählen wir Nominale, so dass es mit einem numerischen Typ verwechselt werden kann, aber es ist nicht.
quelle
Ich habe diese Frage bei der Suche nach Messwerten und verwandten Konzepten gefunden. Ich denke, den Diagrammen in der Frage fehlt der Kontext. Bei der Kategorisierung definieren wir die Regeln für die Gruppierung der Objekte nach unserem Zweck. Was ist der Zweck? Und sprechen wir über die Variablen?
Wir könnten Variablen nach den Messebenen kategorisieren , dann könnten wir 4 Skalen (Gruppen) mit den folgenden Regeln haben:
nominal : Attribute einer Variablen werden nur nach Name (Kategorie) unterschieden und es gibt keine Reihenfolge (Rang, Position).
Ordnungszahl : Attribute einer Variablen werden nach Reihenfolge (Rang, Position) unterschieden, aber wir kennen den relativen Grad der Differenz zwischen ihnen nicht.
Intervall : Attribute einer Variablen werden durch den Grad der Differenz zwischen ihnen unterschieden, es gibt jedoch keinen absoluten Nullpunkt, und das Verhältnis zwischen den Attributen ist unbekannt.
Verhältnis : Attribute einer Variablen werden durch den Grad der Differenz zwischen ihnen unterschieden, es gibt einen absoluten Nullpunkt und wir könnten das Verhältnis zwischen den Attributen finden.
Und dies ist nur ein Ansatz von Stanley Smith Stevens. Es gibt mehrere andere Typologien.
Kontinuierliche und diskrete Variablen sind mathematische Konzepte, bei denen wir eine Reihe von reellen Zahlen haben und:
Die kontinuierliche Variable kann einen beliebigen Wert in diesem Bereich annehmen. Die Anzahl der zulässigen Werte ist unzählig.
während für diskrete Variablen die Anzahl der zulässigen Werte im Bereich entweder endlich oder zählbar unendlich ist.
quelle