Kennt jemand, wie der Titel schon sagt, ein gutes, aktuelles Buch, das die Datenvorverarbeitung im Allgemeinen und insbesondere Ausreißererkennungstechniken behandelt?
Das Buch muss sich nicht ausschließlich darauf konzentrieren, aber es sollte sich ausführlich mit den oben genannten Themen befassen - ich würde mich nicht über etwas freuen, das ein Ausgangspunkt ist, und eine Liste von Artikeln zitieren, in denen Erklärungen der verschiedenen Techniken erscheinen müssen das Buch selbst.
Techniken zum Umgang mit fehlenden Daten vorzuziehen, aber nicht notwendig ...
Antworten:
Obwohl speziell für Stata, habe ich Scott Longs Buch " Der Workflow der Datenanalyse mit Stata" gefunden , das im Bereich der Datenverwaltung und -vorbereitung von unschätzbarem Wert ist. Der Autor gibt viele hilfreiche Ratschläge zu bewährten Methoden im Datenmanagement, z. B. Bereinigen und Archivieren von Daten, Überprüfen auf Ausreißer und Umgang mit fehlenden Daten.
quelle
Für SAS gibt es Ron Codys Datenbereinigungstechniken mit SAS-Software . Auf SAS-L steht ein Sprichwort: "Mit einem Buch von Ron Cody kann man nichts falsch machen."
quelle
Wenn Sie die Grundlagen (Identifizieren von Ausreißern, fehlende Werte, Gewichtung, Codierung) je nach Thema haben, finden Sie in der einfachen akademischen Literatur viel mehr. Zum Beispiel gibt es in der Umfrageforschung (ein Thema, bei dem viele Dinge schief gehen können und das zu vielen Ursachen von Voreingenommenheit neigt) viele gute Artikel.
Bei der Vorbereitung auf eine regelmäßige Querschnittsregression sind die Dinge möglicherweise weniger komplex. Das Problem kann beispielsweise sein, dass Sie zu viele Ausreißer entfernen und so Ihr Modell künstlich gut anpassen.
Ich empfehle Ihnen daher neben dem Erlernen guter Techniken auch, den gesunden Menschenverstand im Auge zu behalten. Stellen Sie sicher, dass Sie die Techniken richtig und nicht blind anwenden. Wie für die Software-Diskussion in den anderen Antworten. Ich denke, SPSS ist nicht schlecht für die Datenaufbereitung (ich habe auch gute Dinge über SAS gehört), abhängig von Ihrer Datensatzgröße. Die Dropdown-Menüs sind sehr intuitiv.
Als direkte Antwort auf Ihre Frage kann akademische Literatur je nach Thema und Analyse eine sehr gute Quelle für Ihre Datenaufbereitung sein oder auch nicht.
quelle