Inspiriert von " Beispielen gängiger Distributionen aus der Praxis ", frage ich mich, welche pädagogischen Beispiele Menschen verwenden, um eine negative Schiefe zu demonstrieren. Es gibt viele "kanonische" Beispiele für symmetrische oder Normalverteilungen im Unterricht - auch wenn solche wie Größe und Gewicht eine genauere biologische Prüfung nicht überstehen! Der Blutdruck könnte sich der Normalität nähern. Ich mag astronomische Messfehler - von historischem Interesse, es ist intuitiv nicht wahrscheinlicher, dass sie in eine Richtung als in eine andere liegen, wobei kleine Fehler wahrscheinlicher sind als große.
Häufige pädagogische Beispiele für eine positive Schiefe sind das Einkommen der Menschen; Laufleistung für Gebrauchtwagen zum Verkauf; Reaktionszeiten in einem Psychologieexperiment; Hauspreise; Anzahl der Unfallschäden eines Versicherungskunden; Anzahl der Kinder in einer Familie. Ihre physikalische Angemessenheit beruht häufig darauf, dass sie unter (gewöhnlich durch Null) begrenzt sind, wobei niedrige Werte plausibel sind, und es ist bekannt, dass sogar übliche, jedoch sehr große (manchmal um Größenordnungen höhere) Werte auftreten.
Bei negativen Abweichungen fällt es mir schwerer, eindeutige und anschauliche Beispiele zu nennen, die ein jüngeres Publikum (Abiturienten) intuitiv erfassen kann, vielleicht weil weniger Verteilungen im wirklichen Leben eine klare Obergrenze haben. Ein schlechtes Beispiel, das mir in der Schule beigebracht wurde, war die "Anzahl der Finger". Die meisten Leute haben zehn, aber einige verlieren einen oder mehrere bei Unfällen. Das Fazit war "99% der Menschen haben überdurchschnittlich viele Finger"! Polydaktylie kompliziert das Problem, da zehn keine strenge Obergrenze ist; Da sowohl fehlende als auch zusätzliche Finger selten sind, kann es für Schüler unklar sein, welcher Effekt überwiegt.
Normalerweise verwende ich eine Binomialverteilung mit hohem . Die Schüler stellen jedoch häufig fest, dass die "Anzahl zufriedenstellender Komponenten in einer Charge negativ verzerrt" weniger intuitiv ist als die ergänzende Tatsache, dass die "Anzahl fehlerhafter Komponenten in einer Charge positiv verzerrt" ist. (Das Lehrbuch ist industriell gestaltet. Ich bevorzuge rissige und intakte Eier in einer Schachtel mit zwölf Stück.) Vielleicht sind die Schüler der Meinung, dass "Erfolg" selten sein sollte.
Eine andere Möglichkeit besteht darin, darauf hinzuweisen, dass, wenn positiv verzerrt ist, - X negativ verzerrt ist, dies jedoch in einen praktischen Kontext zu stellen ("negative Immobilienpreise sind negativ verzerrt"), scheint zum pädagogischen Scheitern verurteilt. Obwohl es Vorteile bringt, die Auswirkungen von Datentransformationen zu lehren, erscheint es sinnvoll, zunächst ein konkretes Beispiel zu nennen. Ich würde eines vorziehen, das nicht künstlich erscheint, bei dem der negative Versatz ziemlich eindeutig ist und bei dem die Lebenserfahrung der Schüler ihnen ein Bewusstsein für die Form der Verteilung vermitteln sollte.
quelle
Antworten:
In Großbritannien der Preis eines Buches. Es gibt einen "empfohlenen Einzelhandelspreis", der im Allgemeinen der Modalpreis ist, und praktisch nirgendwo müssten Sie mehr bezahlen. Aber einige Geschäfte werden rabattieren, und einige werden stark rabattieren.
Auch Alter im Ruhestand. Die meisten Menschen gehen im Alter von 65 bis 68 Jahren in den Ruhestand, wenn die staatliche Rente in Kraft tritt. Sehr wenige Menschen arbeiten länger, aber einige Menschen gehen in den 50ern in den Ruhestand und ziemlich viele in den frühen 60ern.
Auch die Anzahl der GCSEs, die Menschen bekommen. Die meisten Kinder werden für 8-10 eingetragen und erhalten so 8-10. Eine kleine Anzahl kann mehr. Einige der Kinder bestehen jedoch nicht alle Prüfungen, so dass es einen stetigen Anstieg von 0 auf 7 gibt.
quelle
Nick Cox kommentierte genau, dass "das Alter beim Tod in Industrieländern negativ ist", was ich für ein großartiges Beispiel hielt.
Ich fand die besten Zahlen , die ich meine Hände legen konnte kam aus dem Australian Bureau of Statistics ( insbesondere ich verwenden , um diesen Excel - Sheet ), da ihr Alter Bins ging bis zu 100 - Jährigen und die ältesten australischen Männchen waren 111 , so dass ich Ich fühlte mich wohl, als ich nach 110 Jahren die letzte Mülltonne abschnitt. Andere nationale statistische Ämter schienen oft bei 95 anzuhalten, was die letzte Tonne unangenehm breit machte. Das resultierende Histogramm zeigt einen sehr deutlichen negativen Versatz sowie einige andere interessante Merkmale, wie zum Beispiel einen kleinen Höchstwert der Sterblichkeitsrate bei kleinen Kindern, der sich gut für die Diskussion und Interpretation im Unterricht eignet.
R-Code mit Rohdaten folgt, das
HistogramTools
Paket erwies sich als sehr nützlich für das Plotten basierend auf aggregierten Daten! Dank dieser StackOverflow-Frage zum Markieren.quelle
Hier sind die Ergebnisse für die vierzig Athleten, die in der Qualifikationsrunde des olympischen Männer-Weitsprungs 2012 einen legalen Sprung erfolgreich absolviert haben.
Es scheint viel einfacher zu sein, einen Meter hinter der Hauptkonkurrentengruppe zu sein, als einen Meter voraus zu sein, was die negative Schiefe erklären würde.
Ich vermute, dass einige der Gruppen am oberen Ende auf die Zielqualifikation der Athleten zurückzuführen sind (für die ein Top-12-Ergebnis oder ein Ergebnis von 8,10 Metern oder mehr erforderlich war), anstatt die größtmögliche Distanz zu erreichen. Die Tatsache, dass die ersten beiden Ergebnisse 8,11 Meter über der automatischen Qualifikationsmarke lagen, ist eine starke Andeutung, ebenso wie die Art und Weise, wie die medaillengewinnenden Sprünge im Finale mit 8,31, 8,16 und 8,12 Metern länger und breiter waren. Die Ergebnisse im Finale wiesen einen leichten, nicht signifikanten, negativen Versatz auf.
Zum Vergleich stehen die Ergebnisse für den Olympischen Siebenkampf in Seoul 1988 im
heptathlon
Datensatz des R-Pakets zur VerfügungHSAUR
. In diesem Wettbewerb gab es keine Qualifikationsrunde, aber jede Veranstaltung trug Punkte zur endgültigen Klassifizierung bei. Die Teilnehmerinnen zeigten im Hochsprung eine ausgeprägte negative Schiefe und im Weitsprung eine etwas negative Schiefe. Interessanterweise wurde dies bei den Wurfereignissen (Schuss und Speer) nicht wiederholt, obwohl es sich auch um Ereignisse handelt, bei denen eine höhere Zahl einem besseren Ergebnis entspricht. Die endgültigen Punktzahlen waren ebenfalls etwas negativ verzerrt.Daten und Code
quelle
Ergebnisse bei einfachen Tests oder Ergebnisse bei Tests, für die die Schüler besonders motiviert sind, neigen dazu, schief zu liegen.
Infolgedessen tendieren die SAT / ACT-Werte von Studenten, die gesuchte Colleges (und noch mehr ihre GPAs) besuchen, dazu, schief zu liegen. Es gibt viele Beispiele auf collegeapps.about.com, zB eine Handlung der University of Chicago SAT / ACT und GPA ist hier .
In ähnlicher Weise sind die GPAs von Absolventen häufig schief, z. B. die folgenden Histogramme von GPAs von weißen und schwarzen Absolventen an einer gemeinnützigen Universität aus Abb. 5 aus Gramling, Tim. " Wie genau die fünf Merkmale eines Studenten die Gewinnchancen eines Universitätsabschlusses vorhersagen ." SAGE Open 3.3 (2013): 2158244013497026.
(Es ist nicht schwer, andere, ähnliche Beispiele zu finden.)
quelle
In der Stochastic Frontier Analysis und speziell in ihrem historisch anfänglichen Fokus wird die Produktion, die Produktionsfunktion eines Unternehmens / einer Produktionseinheit im Allgemeinen, stochastisch als spezifiziert
woherσ2 ist die Standardabweichung der "zugrunde liegenden" normalen Zufallsvariablen, deren absoluter Wert die Halbnormale ist.
Der zusammengesetzte Fehlerbegriffε = u - w zeichnet sich durch folgende Dichte aus
This is a skew-normal density, with location parameter0 , scale parameter s2 and skew parameter (−σ2σu) , where ϕ and Φ are the standard normal pdf and cdf respectively. For σu=1,σ2=3 , the density looks like this:
So negative skewness is, I'd say,the most natural modelling of the efforts of human race itself: always deviating from its imagined ideal -in most cases lagging behind it (the negative part of the density), while in relatively fewer cases, transcending its perceived limits (the positive part of the density) . Students themselves can be modeled as such a production function. It is straightforward to map the symmetric disturbance and the one-sided error to aspects of real life. I cannot imagine how more intuitive can one get about it.
quelle
Negative skewness is common in flood hydrology. Below is an example of a flood frequency curve (South Creek at Mulgoa Rd, lat -33.8783, lon 150.7683) which I've taken from 'Australian Rainfall and Runoff' (ARR) the guide to flood estimation developed by Engineers, Australia.
There is a comment in ARR:
Often floods, at a particular location, are considered to have an upper bound called the 'Probable Maximum Flood' (PMF). There are standard ways of calculating a PMF.
quelle
Asset price changes (returns) typically have negative skew - many small price increases with a few large price drops. The skew seems to hold for almost all types of assets: stocks prices, commodity prices, etc. The negative skew can be observed in monthly price changes but is much more evident when you start looking at daily or hourly price changes. I think this would be a good example because you can show the effects of frequency on skew.
Weitere Details: http://www.fusioninvesting.com/2010/09/what-is-skew-and-why-is-it-important/
quelle
Gestational age at delivery (especially for live births) is left skewed. Infants can be born alive very early (although chances of continued survival are small when too early), peak between 36-41 weeks, and drop fast. It is typical for women in the US to be induced if 41/42 weeks, so we don't usually see many deliveries after that point.
quelle
In fisheries there are often examples of negative skew because of regulatory requirements. For instance the length distribution of fish released in recreational fishery; because there is sometimes a minimum length that a fish must be in order for it to be retained all fish under the limit are discarded. But because people fish where there tends to be legal length fish there tends to be negative skew and mode towards the upper legal limit. The legal length does not represent a hard cut off though. Because of bag limits (or limits on the number of fish that can be brought back to the dock), people will still discard legal size fish when they have caught larger ones.
e.g., Sauls, B. 2012. A Summary of Data on the Size Distribution and Release Condition of Red Snapper Discards from Recreational Fishery Surveys in the Gulf of Mexico. SEDAR31-DW11. SEDAR, North Charleston, SC. 29 pp.
quelle
Some great suggestions have been made on this thread. On the theme of age-related mortality, machine failure rates are frequently a function of machine age and would fall into this class of distributions. In addition to the financial factors already noted, financial loss functions and distributions typically resemble these shapes, particularly in the case of extreme-valued losses, e.g., as found in BIS III (Bank of International Settlement) estimates of expected shortfall (ES), or in BIS II the value at risk (VAR) as inputs to regulatory requirements for capital reserve allocations.
quelle
Das Renteneintrittsalter in den USA ist negativ verzerrt. Die Mehrheit der Rentner ist älter, einige wenige sind relativ jung.
quelle
In der Zufallsmatrixtheorie ist die Tracy Widom-Verteilung is right-skewed. This is the distribution of the largest eigenvalue of a random matrix. By symmetry, the smallest eigenvalue has negative Tracy Widom distribution, and is therefore left-skewed.
Dies liegt grob an der Tatsache, dass zufällige Eigenwerte geladenen Teilchen ähneln, die sich gegenseitig abstoßen, und daher der größte Eigenwert dazu neigt, vom Rest weggeschoben zu werden. Hier ist ein übertriebenes Bild (von hier ):
quelle