Meine Frage ist: Gibt es eine Reihe von Daten, die es ermöglichen, dass der Median größer als der Modus, der Modus größer als der Mittelwert und der Mittelwert größer als der Bereich ist? Wenn ja, gibt es ein Muster oder eine bestimmte Eigenschaft eines Datensatzes, um diese Situation zuzulassen (Schiefe vielleicht ...)?
PS Ich habe meinen Tippfehler korrigiert. Einige der bereits gegebenen Antworten beziehen sich auf die entgegengesetzte Situation, für die der Median gilt
Antworten:
Die Frage wurde bereits bejaht, aber lassen Sie uns dies unter dem Gesichtspunkt der Konstruktion betrachten - wie erstellen wir einen Datensatz, der dies tut?
Beachten Sie zunächst, dass wir immer alle drei Standortmaße größer als den Bereich machen können. Erstellen Sie einfach einen vorläufigen Datensatz mit dem Median> Modus> Mittelwert und berechnen Sie den Bereich. Fügen Sie nun (Bereichsmittelwert) + (für einige kleine positive ) zu allen Datenwerten hinzu, um den endgültigen Datensatz zu erhalten, woraufhin alle drei Positionsmaße den Bereich überschreiten.ϵ ϵ
Wir haben das Problem nun auf das Finden eines Datensatzes reduziert, bei dem Median> Modus> Mittelwert ist.
Stellen Sie sich vor, wir hätten bereits einige Daten mit einem geeigneten Median und Modus. Um den Mittelwert kleiner als den Median und den Modus zu machen, platzieren Sie einfach einen einzelnen Wert weit genug unter dem Großteil der Daten, dass der Mittelwert heruntergezogen wird. Wir können einen zweiten Wert direkt über dem Großteil der Daten platzieren, um den Median dort zu belassen, wo er war, ohne den Modus zu ändern. Jetzt können wir einen vorhandenen Datensatz ändern, der einfach den Median> -Modus hat, und einen erhalten, der den Mittelwert hat, wo wir wollen.
Erstellen wir also eine mit dem Median> -Modus. Wir können dies tun, indem wir einen Wert wiederholen lassen (wenn dies der einzige Wert ist, der zweimal auftritt, ist dies der Beispielmodus) und dann genügend andere Werte hinzufügen, um den Median größer zu machen. Dies ist ein Beispiel:
Der Median ist 22, aber der Modus ist 21.
Fügen wir nun die beiden zuvor beschriebenen Punkte hinzu, um den Mittelwert 20 zu erhalten, ohne den Median oder den Modus zu ändern. Die gegenwärtigen Punkte summieren sich zu 111, also brauchen wir zwei Punkte, die zu 140-111 = 29 addieren, und einer von ihnen sollte nur größer als 24 sein. Machen wir es 25. Dann ist der kleinere Punkt 29-25 = 4.
Unser Datensatz lautet nun:
Es hat Mittelwert 20, Modus 21 und Median 22.
Lassen Sie uns nun die Beziehung zwischen denen und dem Bereich festlegen. Was ist die Reichweite? Es ist 25-4 = 21, was derzeit größer als der Mittelwert ist. Wir müssen einfach jedem Datenwert etwas hinzufügen, um den Mittelwert größer als 21 zu machen, wodurch der Bereich unverändert bleibt. Das Hinzufügen von 2 reicht aus. (Beachten Sie, dass der Bereichsmittelwert + 1 = 2 ist, damit wir sehen können, dass wir )ϵ=1
Unser endgültiger Datensatz ist also
Der Bereich ist immer noch 21, der Mittelwert ist jetzt 22, der Modus ist 23, der Median ist 24
Dieser schrittweise Ansatz ist also recht einfach anzuwenden. Zusammenfassend:
Erstellen Sie einen kleinen Datensatz mit dem Median> -Modus, indem Sie den kleinsten Wert wiederholen und alle größeren Werte unterscheiden (es ist am einfachsten, sortierte Werte zu verwenden). 5 Punkte zu haben ist praktisch (da Sie den Median durch Verschieben des Mittelwerts angeben können), aber 4 ist bei Bedarf möglich.
Erhalten Sie einen Mittelwert unter dem Median, indem Sie zwei Punkte hinzufügen, die den Median oder den Modus nicht ändern (dh zwei unterschiedliche / Singleton-Werte stören den Modus nicht, und wenn Sie sie auf einer Seite platzieren, behalten die vorherigen Daten den Median bei; platzieren Sie den größeren Wert vor allem die aktuellen Daten und dann die kleinsten berechnen, so dass der Gesamtmittelwert knapp unter dem Modus liegt. Dies bringt uns zu 7 Datenpunkten.
Berechnen Sie den Bereich. Fügen Sie allen Datenwerten eine Konstante (Bereich - Mittelwert + ) hinzu, um sicherzustellen, dass der Mittelwert den Bereich überschreitet. Dies ist der endgültige Datensatz.ϵ
Überprüfen dieser Berechnungen in R:
(Beachten Sie, dass diese Berechnung versucht, den größten von ihnen zu finden, wenn wir irgendwie mehr als einen Modus generiert haben.)
quelle
Ja, es ist nicht schwer, ein solches Set zu entwickeln.
S = {0, 1, 2, 3, 4, 4, 1000}
Median = 3, Modus = 4, Mittelwert = 144,85, Bereich = 1000
Daten dieser Art werden nach rechts verschoben, da Ihr Mittelwert höher als der Median ist, was bedeutet, dass Werte über dem Median im Durchschnitt weiter entfernt sind als Werte unter dem Median.
quelle
Unabhängig von der Reihenfolge lautet die Antwort Ja. Bei Datensätzen, bei denen es sich um Teilmengen von Verteilungen handelt, deren linker Schwanz schwerer als ihr rechter Schwanz ist, ist der Modus häufig kleiner als der Median und der Median kleiner als der Mittelwert und der Mittelwert kleiner als der Bereich. Eine Beta-Distribution mit dem Modus größer 1/2 hätte diese Eigenschaft. Wenn man den Modus an einer bestimmten Position haben möchte, kann man eine Mischungsverteilung vornehmen, indem man einen kleinen Prozentsatz einer engen (kleinen) Standardabweichung, aber einer hohen Verteilung, z. B. Dirac , addiert , wo immer man diesen Modus einsetzen möchte.δ
quelle