Ich versuche derzeit, ein lineares Modell ( family = gaussian
) auf einen Indikator für die biologische Vielfalt anzuwenden , der keine Werte unter Null annehmen kann, keine Inflation aufweist und kontinuierlich ist. Die Werte reichen von 0 bis etwas über 0,25. Infolgedessen gibt es in den Residuen des Modells ein ziemlich offensichtliches Muster, das ich nicht beseitigen konnte:
Hat jemand irgendwelche Ideen, wie man das löst?
Antworten:
Für den Fall von nicht aufgeblasenen (halb-) kontinuierlichen Verteilungen gibt es verschiedene Lösungen:
Wenn Ihre Datenstruktur einfach genug ist, können Sie auch lineare Modelle und Permutationstests oder einen anderen robusten Ansatz verwenden, um sicherzustellen, dass Ihre Schlussfolgerung nicht durch die interessante Verteilung der Daten verfälscht wird.
Für die meisten dieser Fälle stehen R-Pakete / -Lösungen zur Verfügung.
Es gibt noch andere Fragen zur SE zu (halb-) kontinuierlichen Daten ohne Inflation (z. B. hier , hier und hier ), aber sie scheinen keine eindeutige allgemeine Antwort zu bieten ...
Siehe auch Min & Agresti, 2002, Modellierung nichtnegativer Daten mit Clumping at Zero: A Survey für eine Übersicht.
quelle