Wir sagen immer, dass Statistiken nur Daten betreffen. Wir wissen aber auch, dass die Informatik auch Wissen aus der Datenanalyse erhält. Zum Beispiel können Menschen der Bioinformatik ganz auf Biostatistik verzichten. Ich möchte wissen, was der wesentliche Unterschied zwischen Statistik und Informatik ist.
bioinformatics
Honglang Wang
quelle
quelle
Antworten:
Ausgezeichnete Frage !!
Ich habe mehrmals gehört, dass Bioinformatiker ohne Biostatistik oder sogar ohne Statistik auskommen können. Das ist vollkommen wahr, bis es falsch wird. Meiner Meinung nach hat der allgemeine Mangel an statistischen Kenntnissen katastrophale Auswirkungen auf diesem Gebiet, wie Keith Baggerly gezeigt hat . Ich konnte auch beobachten, dass mangelndes Grundwissen in Statistik (und linearer Algebra) auf lange Sicht die Ursache für die Stagnation von Bioinformatikern ist: Ohne tiefes Wissen über die Theorie neigen sie dazu, das Rad neu zu erfinden und auf Ad-hoc- Lösungen zurückzugreifen, die sich lösen nichts als ihr eigenes Problem.
Um Ihre Frage zu beantworten, stimme ich zu, dass Statistiken heutzutage insgesamt nicht ohne Computer auskommen können. Einer der Hauptaspekte der Statistik ist jedoch die Inferenz , die nichts mit Computern zu tun hat. Statistische Inferenz ist eigentlich das, was Statistik zu einer Wissenschaft macht, weil sie Ihnen sagt, ob Ihre Schlussfolgerungen in anderen Kontexten Bestand haben oder nicht.
Kurz gesagt, Sie können Ihre Daten zum Teufel analysieren. Sie benötigen weiterhin Statistiken, um die Gültigkeit der Vorhersagen oder Entscheidungen zu ermitteln, die Sie basierend auf Ihren Analysen treffen werden.
quelle
Meiner Ansicht nach gibt es zwar erhebliche Überschneidungen zwischen den Feldern, aber auch wesentliche Unterschiede. Im Allgemeinen nimmt ein Statistikstudent (in den höheren Abschlüssen) mehr Theorieunterricht (Mathematik und Mathematik) als der Informatikstudent, aber der Informatikstudent lernt mehr über die Computerseite (insbesondere den Datenbankteil).
Die Entwicklung eines neuen statistischen Tests würde eher dem Statistiker als dem Informatiker obliegen, aber das Entwerfen einer Schnittstelle für einen Benutzer zur Eingabe von Daten und zur Erstellung von Tabellen und Plots würde eher dem Informatiker als dem Statistiker überlassen.
Für den Statistiker ist der Computer ein Hilfsmittel für die Statistik. Für den Informatiker sind Statistiken ein Werkzeug, um Informationen zu sammeln und zu verbreiten (über Computer im Allgemeinen).
Bearbeiten Sie hier unten -----
Zum Beispiel hier ein Beispiel. Ich habe an Projekten mit Informatikern gearbeitet (ich bin der Statistiker), bei denen ein Arzt ein System haben möchte, in dem Informationen über Patienten verwendet werden, um das Risiko einer Erkrankung vorherzusagen (z. B. die Entwicklung eines Blutgerinnsels), und eine Form von erhalten möchte Alarm, um sie über das Risiko zu informieren. Meine Rolle im Projekt (die statistische Rolle) besteht darin, ein Modell zu entwickeln, das das Risiko unter Berücksichtigung der Prädiktorvariablen vorhersagt (ein logistisches Regressionsmodell ist ein solches Modell). Die informatische Rolle im Projekt besteht darin, die Werkzeuge zu entwickeln, mit denen die Prädiktorvariablen erfasst werden, mein Modell darauf anzuwenden und die Ergebnisse dann an den Arzt zu senden. Die Daten können aus einer elektronischen Krankenakte oder über einen Dateneingabebildschirm gesammelt werden, den eine Krankenschwester ausfüllen kann, oder über andere.
Jetzt weiß ich (und viele andere Statistiker) genug über die Programmierung, dass ich eine Datenbank abfragen könnte, um die Prädiktoren zu erhalten und eine Art Alarm zu erstellen, aber ich überlasse das gerne den Informatikern (und sie sind sowieso besser darin). Es gibt Informatiker, die genug Statistiken kennen, um zum logistischen Regressionsmodell zu passen. Eine einfache Version dieses Projekts könnte also nur von einem Statistiker oder nur von einem Informatiker erstellt werden, aber es ist am besten, wenn beide zusammenarbeiten. Wenn Sie sich dieses Projekt ansehen und denken, dass der Modellierungsteil der unterhaltsame Teil ist und die Datenerfassung, Warnung und andere Schnittstellen nur Werkzeuge sind, um die Informationen zum und vom Modell zu verschieben, sind Sie eher ein Statistiker. Wenn Sie das Entwerfen der Benutzeroberfläche, das Optimieren des Datenabrufs, das Testen verschiedener Arten von Warnungen usw. sehen.
quelle
Statistiken folgert aus den Daten; Die Informatik arbeitet mit Daten. Natürlich überschneiden sie sich, aber die Frage, welche den größeren Umfang hat, hat keine Antwort.
quelle