Wie kann man die Anpassungsgüte einer Trendlinie an ein Potenzgesetz messen / argumentieren?

21

Ich habe einige Daten, an die ich eine Trendlinie anpassen möchte. Ich bin der Meinung, dass die Daten einem Potenzgesetz folgen, und habe daher die Daten auf Log-Log-Achsen aufgezeichnet, die nach einer geraden Linie suchen. Dies hat zu einer (fast) geraden Linie geführt und so habe ich in Excel eine Trendlinie für ein Potenzgesetz hinzugefügt. Als ein Statistik NEWB, meine Frage ist, was ist jetzt der beste Weg für uns zu gehen „und die Linie sieht zu , wie es recht gut paßt“ „numerische Eigenschaft beweist , dass dieser Graph in geeigneter Weise durch ein Potenzgesetz eingebaut ist“? x

In Excel kann ich einen quadratischen Wert erhalten, obwohl ich aufgrund meiner begrenzten statistischen Kenntnisse nicht einmal weiß, ob dies unter meinen spezifischen Umständen tatsächlich angemessen ist. Ich habe unten ein Bild eingefügt, das die grafische Darstellung der Daten zeigt, mit denen ich in Excel arbeite. Ich habe ein wenig Erfahrung mit R. Wenn meine Analyse durch meine Tools eingeschränkt wird, bin ich offen für Vorschläge, wie ich sie mithilfe von R verbessern kann.

Alt-Text

Bryce Thomas
quelle
Vielleicht finden Sie hier einige Ideen freakonometrics.blog.free.fr/index.php?post/2010/09/29/…

Antworten:

24

Siehe Aaron Clausets Seite:

Hier finden Sie Links zu Code für die Anpassung von Potenzgesetzen (Matlab, R, Python, C ++) sowie eine Veröffentlichung von Clauset und Shalizi, die Sie zuerst lesen sollten.

Vielleicht möchten Sie zuerst die Blogbeiträge von Clauset und Shalizi lesen:

Eine Zusammenfassung des letzten Links könnte sein:

  • Bei vielen Verteilungen erhalten Sie gerade Linien in einem Protokoll-Protokoll-Diagramm.

  • Der Missbrauch linearer Regression bringt das Baby zum Weinen.
    Es ist eine schlechte Idee, eine Linie nach den kleinsten Quadraten in Ihr Log-Log-Diagramm einzufügen.

  • Verwenden Sie die maximale Wahrscheinlichkeit, um den Skalierungsexponenten zu schätzen.
  • Verwenden Sie die Anpassungsgüte, um abzuschätzen, wo der Skalierungsbereich beginnt.
  • Verwenden Sie einen Passungstest, um die Passung zu überprüfen.
  • Verwenden Sie Vuongs Test, um Alternativen zu prüfen und sich auf Enttäuschungen vorzubereiten.
ars
quelle
1
Ich unterstütze das. Es gibt viele Beispiele für etwas, das aussah wie ein Potenzgesetz, aber bei genauerer Betrachtung stellte sich heraus, dass es nicht so ist ... und nein, das hohe R ^ 2 auf dem Chart reicht nicht aus.
PeterR
"Also du denkst ..." ist eine hervorragende Referenz. Die Punkte 1-6 (von 7) gehen direkt auf die hier gestellte Frage ein.
whuber
Aber ein Potenzgesetz Verteilung ist nicht dasselbe wie eine Potenzgesetz - Beziehung zwischen zwei getrennten Variablen passen. Ich hatte angenommen, die Frage betraf letztere, obwohl ich mir nicht sicher bin.
1.
χ2
2
@JM: Nicht wirklich, Chi-Quadrat ist empfindlich gegen Binning und Schwanzschwankungen erschweren dies. Ich denke, auch bei der KS wird die Statistik für Extrempunkte neu gewichtet, und es gibt einige Diskussionen über andere Tests. @onestop: Ich bin davon ausgegangen, dass Sie beim erneuten Lesen Recht haben könnten. Ich bin mir nicht sicher ..
Ars
3

Wenn Sie an bivariaten Potenzgesetzfunktionen interessiert sind (im Gegensatz zu univariaten Potenzgesetzverteilungen), dann

Warton et al. " Bivariate Linienanpassungsmethoden für die Allometrie ." Biol. Rev. 81, 259-201 (2006)

ist eine ausgezeichnete Referenz. In diesem Fall ist die Regression das Richtige, obwohl es einige Korrekturen geben kann (OLS vs. RMA usw.), je nachdem, was die Ergebnisse der Regression bedeuten sollen.


quelle
Aaron - dieser Link ist tot, könntest du einen neuen posten?
Keflavich
Danke dafür. Die meisten Informationen sind für univariate Verteilungen , die Informationen über bivariate Beziehungen zu begraben neigt ... Hier ist ein Link auf die Riley ist Listing onlinelibrary.wiley.com/doi/abs/10.1017/S1464793106007007
songololo