Dies ist jetzt in ein paar Fragen aufgetaucht, und ich habe mich über etwas gewundert. Hat sich das Feld insgesamt in Richtung "Reproduzierbarkeit" bewegt, wobei der Schwerpunkt auf der Verfügbarkeit der Originaldaten und des fraglichen Codes liegt?
Mir wurde immer beigebracht, dass der Kern der Reproduzierbarkeit nicht unbedingt die Fähigkeit ist, auf Ausführen zu klicken und dieselben Ergebnisse zu erzielen. Der Data-and-Code-Ansatz scheint davon auszugehen, dass die Daten korrekt sind - dass es keinen Fehler in der Sammlung der Daten selbst gibt (oft nachweislich falsch im Fall von wissenschaftlichem Betrug). Sie konzentriert sich auch auf eine einzelne Stichprobe der Zielpopulation und nicht auf die Reproduzierbarkeit des Befundes über mehrere unabhängige Stichproben.
Warum liegt der Schwerpunkt dann darauf, die Analyse wiederholen zu können, anstatt die Studie von Grund auf zu duplizieren?
Der in den Kommentaren unten erwähnte Artikel ist hier verfügbar .
Antworten:
"Reproduzierbare Forschung" als reproduzierbare Analyse
Reproduzierbare Forschung ist ein Begriff, der in einigen Forschungsbereichen speziell für die Durchführung solcher Analysen verwendet wird
Wenn solche Daten und Codes gemeinsam genutzt werden, können andere Forscher:
Diese Verwendung kann in Diskussionen über Technologien wie Sweave gesehen werden . ZB schreibt Friedrich Leisch im Zusammenhang mit Sweave, dass "der Bericht automatisch aktualisiert werden kann, wenn sich Daten oder Analysen ändern, was eine wirklich reproduzierbare Forschung ermöglicht." Aus der CRAN-Task-Ansicht zur reproduzierbaren Forschung geht auch hervor , dass "das Ziel der reproduzierbaren Forschung darin besteht, spezifische Anweisungen an Datenanalysen und experimentelle Daten zu knüpfen, damit die Wissenschaft neu erstellt, besser verstanden und verifiziert werden kann".
Breitere Verwendung des Begriffs "Reproduzierbarkeit"
Reproduzierbarkeit ist ein grundlegendes Ziel der Wissenschaft. Es ist nicht neu Die Forschungsberichte enthalten Abschnitte mit Methoden und Ergebnissen, in denen dargelegt werden soll, wie die Daten generiert, verarbeitet und analysiert wurden. Eine allgemeine Regel ist, dass die bereitgestellten Details ausreichen sollten, um es einem entsprechend kompetenten Forscher zu ermöglichen, die bereitgestellten Informationen zu verwenden und die Studie zu replizieren.
Die Reproduzierbarkeit hängt auch eng mit den Konzepten der Reproduzierbarkeit und Verallgemeinerung zusammen.
Daher ist der Begriff "reproduzierbare Forschung", wie er wörtlich für Technologien wie Sweave verwendet wird, eine falsche Bezeichnung, da er eine Relevanz nahelegt, die breiter ist als sie abdeckt. Wenn Forscher, die solche Technologien nicht verwendet haben, Technologien wie Sweave vorstellen, wundern sich diese Forscher oft, wenn ich den Prozess als "reproduzierbare Forschung" bezeichne.
Ein besserer Begriff als "reproduzierbare Forschung"
Da "reproduzierbare Forschung", wie sie in Sweave-ähnlichen Kontexten verwendet wird, nur einen Aspekt reproduzierbarer Forschung betrifft, sollte möglicherweise ein alternativer Begriff verwendet werden. Mögliche Alternativen sind:
Alle oben genannten Begriffe spiegeln genauer wider, was Sweave-ähnliche Analysen beinhalten. Die reproduzierbare Analyse ist kurz und bündig. Das Hinzufügen von "Daten" oder "Statistik" verdeutlicht die Dinge weiter, führt aber auch dazu, dass der Begriff sowohl länger als auch enger wird. Darüber hinaus hat "statistisch" eine enge und eine breite Bedeutung, und innerhalb der engen Bedeutung ist ein Großteil der Datenverarbeitung nicht statistisch. Somit hat die Breite, die der Begriff "reproduzierbare Analyse" impliziert, seine Vorteile .
Es geht nicht nur um Reproduzierbarkeit
Das andere zusätzliche Problem mit dem Begriff "reproduzierbare Forschung" ist das Ziel, dass Sweave-ähnliche Technologien nicht nur "Reproduzierbarkeit" sind. Es gibt mehrere miteinander verbundene Ziele:
Es gibt ein Argument, dass reproduzierbare Analysen korrekte Analysen fördern sollten, da es eine schriftliche Aufzeichnung von Analysen gibt, die überprüft werden können. Wenn Daten und Code gemeinsam genutzt werden, entsteht eine Rechenschaftspflicht, die die Forscher dazu motiviert, ihre Analysen zu überprüfen, und die es anderen Forschern ermöglicht, Korrekturen zu notieren.
Die reproduzierbare Analyse passt auch gut zu Konzepten rund um die offene Forschung. Natürlich kann ein Forscher Sweave-ähnliche Technologien nur für sich selbst verwenden. Offene Forschungsprinzipien fördern die gemeinsame Nutzung von Daten und Analysecode, um eine bessere Wiederverwendung und Rechenschaftspflicht zu ermöglichen.
Dies ist keine wirkliche Kritik an der Verwendung des Wortes "reproduzierbar". Es wird lediglich hervorgehoben, dass der Einsatz von Sweave-ähnlichen Technologien notwendig ist, aber nicht ausreicht, um offene wissenschaftliche Forschungsziele zu erreichen.
quelle
R
in der Veröffentlichung verwendeten Code teilen kann. Der Autor hat dies abgelehnt und mich auf die Veröffentlichung hingewiesen. Würden Sie dies Ihrer Meinung nach als mangelnde Offenheit für reproduzierbare Forschung ansehen oder ist es ausreichend, die Methodik im Journal zu verdeutlichen und andere den Code selbst programmieren zu lassen? Vielen DankDer Zugriff auf die Daten und den Code für die Analyse in einer einfach auszuführenden Form ist eine unabdingbare Voraussetzung für reproduzierbare Forschung. Sobald Sie überprüft haben, dass die Analyse funktioniert, können Sie Ihren eigenen Code / Ihre eigenen Daten ersetzen, wenn Sie dem des ursprünglichen Autors skeptisch gegenüberstehen. Ich würde sagen, dass die Mehrheit der statistischen Artikel, die ich lese, mindestens einen Teil der Methodik enthält, der vage bleibt. Meine Versuche, diese Analysen zu reproduzieren, sind oft erfolglos (und immer zeitaufwendig), aber es ist sehr schwierig zu sagen, ob dies auf Betrug, menschliches Versagen oder (viel wahrscheinlicher) auf eine andere Lösung als der Autor zurückzuführen ist. Wenn Sie also Daten + Code für ein Papier haben, ist dies keine Garantie für die Richtigkeit der Schlussfolgerungen, aber es erleichtert die Kritik oder Erweiterung dieser Schlussfolgerungen erheblich.
Auch "reproduzierbare Forschung" ist eine Frage des Grades. Die reproduzierbare Forschungsbewegung kann daher als ermutigend angesehen werden, Forschung zu betreiben, die "reproduzierbarer" als die Norm ist, anstatt zu fordern, dass Forschung eine Mindestschwelle erreicht. Ich würde vermuten, dass "Daten und Code freigeben" derzeit in Mode ist, da dies ein relativ einfacher und nicht bedrohlicher Schritt ist.
quelle
Alles nachvollziehen zu können, ist ein Ausgangspunkt für die reproduzierbare Recherche. Es kann gezeigt werden, dass Sie tatsächlich dasselbe Verfahren anwenden. Danach - und erst danach - können Sie die Recherche Ihres Kollegen fortsetzen. Mit anderen Worten, die strikte Reproduzierbarkeit ist nicht als eine Zeit zu verstehen, in der die Forschung voranschreitet, sondern als ein Meilenstein, ein Konsens , über den sich die Menschen einig sind. Ist das nicht grundlegend, um weiterzukommen?
Laut der Diskussion von Donoho (siehe Abschnitt 2 "Der Skandal") besteht das Ziel reproduzierbarer Forschung auch darin, die Robustheit des gegebenen Codes zu testen. Spielen Sie zunächst mit dem Code, und nehmen Sie geringfügige Änderungen vor, die in der Arbeit nicht vorgenommen wurden (weil wir keine Arbeiten mit 30 Abbildungen möchten ...). Ich denke, das Konzept der reproduzierbaren Forschung in der Literatur beinhaltet die Idee, eine starke robuste Landmarke zu haben. Es enthält fast die Idee, weiter zu gehen.
quelle