Was ist der Unterschied zwischen Statistik und Informatik?

10

Wir sagen immer, dass Statistiken nur Daten betreffen. Wir wissen aber auch, dass die Informatik auch Wissen aus der Datenanalyse erhält. Zum Beispiel können Menschen der Bioinformatik ganz auf Biostatistik verzichten. Ich möchte wissen, was der wesentliche Unterschied zwischen Statistik und Informatik ist.

Honglang Wang
quelle
7
Nein, das liegt nur daran, dass das Wort "Informatik" seine endgültige Bedeutung völlig verloren hat. "Bioinformatik" wurde nur für "Biologie am Computer" geprägt, darin steckt nichts Tiefes.
1
@mbq Einverstanden. "Informatik" und "Bioinformatik" haben jede sinnvolle Definition verloren.
Fomite
auf klare Weise Bioinformatik (wenden Sie Ihre Ergebnisse an, um Ihre Ergebnisse auf biologische Weise zu beobachten)
Kamal Alblwei

Antworten:

20

Ausgezeichnete Frage !!

Ich habe mehrmals gehört, dass Bioinformatiker ohne Biostatistik oder sogar ohne Statistik auskommen können. Das ist vollkommen wahr, bis es falsch wird. Meiner Meinung nach hat der allgemeine Mangel an statistischen Kenntnissen katastrophale Auswirkungen auf diesem Gebiet, wie Keith Baggerly gezeigt hat . Ich konnte auch beobachten, dass mangelndes Grundwissen in Statistik (und linearer Algebra) auf lange Sicht die Ursache für die Stagnation von Bioinformatikern ist: Ohne tiefes Wissen über die Theorie neigen sie dazu, das Rad neu zu erfinden und auf Ad-hoc- Lösungen zurückzugreifen, die sich lösen nichts als ihr eigenes Problem.

Um Ihre Frage zu beantworten, stimme ich zu, dass Statistiken heutzutage insgesamt nicht ohne Computer auskommen können. Einer der Hauptaspekte der Statistik ist jedoch die Inferenz , die nichts mit Computern zu tun hat. Statistische Inferenz ist eigentlich das, was Statistik zu einer Wissenschaft macht, weil sie Ihnen sagt, ob Ihre Schlussfolgerungen in anderen Kontexten Bestand haben oder nicht.

Kurz gesagt, Sie können Ihre Daten zum Teufel analysieren. Sie benötigen weiterhin Statistiken, um die Gültigkeit der Vorhersagen oder Entscheidungen zu ermitteln, die Sie basierend auf Ihren Analysen treffen werden.

gui11aume
quelle
Vielen Dank. Könnten Sie mehr darüber erklären, was das allgemeine Prinzip der Bioinformatik ist, um sie zu einer Disziplin zu machen? Für die Statistik gibt es im Allgemeinen zwei Hauptteile: Der eine ist die reine Datenmanipulation, der andere die statistische Inferenz, die auf der Wahrscheinlichkeit basiert, einer der reinen Mathematik. Basierend auf den statistischen Modellen (Wahrscheinlichkeitsmodellen) können statistische Personen Wissenschaft betreiben. Was ist mit Bioinformatik?
Honglang Wang
4
Bioinformatik ist einfach die Verwendung von Computern, um biologische Fragen zu untersuchen. Disziplinen werden normalerweise durch die Fragen definiert, die sie stellen, nicht durch ihre Methoden. Daher sollte die Bioinformatik meiner Meinung nach Teil der Biologie sein. Es hat einen besonderen Namen, weil Biologen sehr schlecht mit Computern umgehen können. Leute, die das können, müssen ein spezielles Etikett haben. Ich bin mir nicht sicher, ob es in 50 Jahren, wenn Biologen besser in IT und Mathematik sind, noch Bioinformatik geben wird.
gui11aume
2
Es ist schön zu sehen, dass jemand anderes Keith 'Bemühungen schätzt. Er hat sich sicherlich nicht vor Kontroversen oder schwierigen und unangenehmen beruflichen Situationen gescheut.
Kardinal
@cardinal Saw Keith sprach vor ein oder zwei Jahren auf einer APHA-Konferenz. Es war eines der besten Gespräche, die ich je gesehen habe.
Fomite
9

Meiner Ansicht nach gibt es zwar erhebliche Überschneidungen zwischen den Feldern, aber auch wesentliche Unterschiede. Im Allgemeinen nimmt ein Statistikstudent (in den höheren Abschlüssen) mehr Theorieunterricht (Mathematik und Mathematik) als der Informatikstudent, aber der Informatikstudent lernt mehr über die Computerseite (insbesondere den Datenbankteil).

Die Entwicklung eines neuen statistischen Tests würde eher dem Statistiker als dem Informatiker obliegen, aber das Entwerfen einer Schnittstelle für einen Benutzer zur Eingabe von Daten und zur Erstellung von Tabellen und Plots würde eher dem Informatiker als dem Statistiker überlassen.

Für den Statistiker ist der Computer ein Hilfsmittel für die Statistik. Für den Informatiker sind Statistiken ein Werkzeug, um Informationen zu sammeln und zu verbreiten (über Computer im Allgemeinen).

Bearbeiten Sie hier unten -----

Zum Beispiel hier ein Beispiel. Ich habe an Projekten mit Informatikern gearbeitet (ich bin der Statistiker), bei denen ein Arzt ein System haben möchte, in dem Informationen über Patienten verwendet werden, um das Risiko einer Erkrankung vorherzusagen (z. B. die Entwicklung eines Blutgerinnsels), und eine Form von erhalten möchte Alarm, um sie über das Risiko zu informieren. Meine Rolle im Projekt (die statistische Rolle) besteht darin, ein Modell zu entwickeln, das das Risiko unter Berücksichtigung der Prädiktorvariablen vorhersagt (ein logistisches Regressionsmodell ist ein solches Modell). Die informatische Rolle im Projekt besteht darin, die Werkzeuge zu entwickeln, mit denen die Prädiktorvariablen erfasst werden, mein Modell darauf anzuwenden und die Ergebnisse dann an den Arzt zu senden. Die Daten können aus einer elektronischen Krankenakte oder über einen Dateneingabebildschirm gesammelt werden, den eine Krankenschwester ausfüllen kann, oder über andere.

Jetzt weiß ich (und viele andere Statistiker) genug über die Programmierung, dass ich eine Datenbank abfragen könnte, um die Prädiktoren zu erhalten und eine Art Alarm zu erstellen, aber ich überlasse das gerne den Informatikern (und sie sind sowieso besser darin). Es gibt Informatiker, die genug Statistiken kennen, um zum logistischen Regressionsmodell zu passen. Eine einfache Version dieses Projekts könnte also nur von einem Statistiker oder nur von einem Informatiker erstellt werden, aber es ist am besten, wenn beide zusammenarbeiten. Wenn Sie sich dieses Projekt ansehen und denken, dass der Modellierungsteil der unterhaltsame Teil ist und die Datenerfassung, Warnung und andere Schnittstellen nur Werkzeuge sind, um die Informationen zum und vom Modell zu verschieben, sind Sie eher ein Statistiker. Wenn Sie das Entwerfen der Benutzeroberfläche, das Optimieren des Datenabrufs, das Testen verschiedener Arten von Warnungen usw. sehen.

Greg Snow
quelle
(+1) Ich mag die Ausgewogenheit dieser Antwort. Ich bin mir nicht sicher, ob ich wirklich verstehe, was mit dem allerletzten Satz gemeint war.
Kardinal
1
Ich finde Ihr Beispiel sehr schön und gibt ein gutes Porträt der Grundlage des Landes. Ich wünschte, ich könnte es für genau diesen Teil noch einmal verbessern. Prost.
Kardinal
Dein Beispiel ist wirklich cool. Vielen Dank. Jetzt frage ich mich nur noch eine Frage. Ob für Statistiker alle statistischen Modelle einen Inferenzteil wie Konfidenzintervall oder Hypothesentest haben sollten und daher auf Wahrscheinlichkeitsmodellen basieren sollten? Andernfalls manipulieren sie den Datensatz nur durch Zeichnen und Zusammenfassen.
Honglang Wang
9

Statistiken folgert aus den Daten; Die Informatik arbeitet mit Daten. Natürlich überschneiden sie sich, aber die Frage, welche den größeren Umfang hat, hat keine Antwort.

stackovergio
quelle
"Statistiken schließen aus Daten; Informatik arbeitet mit Daten." Das möchte ich wirklich bestätigen. Für die Folgerung, die immer auf der Wahrscheinlichkeitsverteilung basiert, sollte sie ein Konfidenzintervall oder einen Hypothesentest enthalten. Ansonsten bearbeiten Sie nur Daten.
Honglang Wang