In der Mathematik gibt es Zweige wie Algebra, Analyse, Topologie usw. Im maschinellen Lernen gibt es überwachtes, unbeaufsichtigtes und bestärkendes Lernen. Innerhalb jedes dieser Zweige gibt es feinere Zweige, die die Methoden weiter unterteilen.
Ich habe Probleme, eine Parallele zur Statistik zu ziehen. Was wären die Hauptzweige der Statistik (und Unterzweige)? Eine perfekte Partition ist wahrscheinlich nicht möglich, aber alles ist besser als eine große leere Karte.
self-study
classification
silly.deer
quelle
quelle
Antworten:
Ich finde diese Klassifikationssysteme äußerst wenig hilfreich und widersprüchlich. Beispielsweise:
und so weiter. Es gibt keine eindeutigen "Zweige" der Mathematik und es sollte auch keine Statistik geben.
quelle
Dies ist ein kleiner Kontrapunkt zu Rob Hyndmans Antwort. Es begann als Kommentar und wurde dann zu komplex für einen. Wenn dies zu weit von der Beantwortung der Hauptfrage entfernt ist, entschuldige ich mich und werde sie löschen.
Die Biologie beschreibt hierarchische Beziehungen seit langem vor Darwins erstem Gekritzel (siehe den Kommentar von Nick Cox für einen Link). Die meisten evolutionären Beziehungen werden immer noch mit dieser Art von schönem, sauberem, verzweigtem "phylogenetischen Baum" gezeigt:
Wir haben jedoch irgendwann festgestellt, dass die Biologie unordentlicher ist. Gelegentlich gibt es einen genetischen Austausch (durch Kreuzung und andere Prozesse) zwischen verschiedenen Arten und Genen, die in einem Teil des Baumes vorhanden sind, und einen Sprung zu einem anderen Teil des Baumes. Der horizontale Gentransfer bewegt Gene auf eine Weise, die die oben dargestellte einfache Baumdarstellung ungenau macht. Wir haben jedoch keine Bäume aufgegeben, sondern lediglich Änderungen an dieser Art der Visualisierung vorgenommen:
Dies ist schwieriger zu verfolgen, vermittelt jedoch ein genaueres Bild der Realität.
Ein anderes Beispiel:
Wir führen diese komplexeren Zahlen jedoch nie anfangs ein, da sie schwer zu erfassen sind, ohne die Grundkonzepte zu verstehen. Stattdessen unterrichten wir die Grundidee mit der einfachen Figur und präsentieren ihnen dann die komplexere Figur und die neueren Komplikationen der Geschichte.
Jede "Karte" von Statistiken wäre gleichermaßen ungenau und ein wertvolles Lehrmittel. Visualisierungen des Formulars, das OP vorschlägt, sind für Studenten sehr nützlich und sollten nicht ignoriert werden, nur weil sie die Realität nicht vollständig erfassen. Wir können dem Bild mehr Komplexität hinzufügen, wenn sie über einen grundlegenden Rahmen verfügen.
quelle
Sie können sich die Keywords / Tags der Cross Validated-Website ansehen .
Filialen als Netzwerk
Eine Möglichkeit, dies zu tun, besteht darin, es als Netzwerk darzustellen, das auf den Beziehungen zwischen den Keywords basiert (wie oft sie im selben Beitrag übereinstimmen).
Wenn Sie dieses SQL-Skript verwenden, um die Daten der Site abzurufen (data.stackexchange.com/stats/query/edit/1122036)
Anschließend erhalten Sie eine Liste mit Stichwörtern für alle Fragen mit einer Punktzahl von 2 oder höher.
Sie können diese Liste untersuchen, indem Sie Folgendes zeichnen:
Update: das gleiche mit Farbe (basierend auf Eigenvektoren der Relationsmatrix) und ohne das Selbststudien-Tag
Sie könnten diesen Graphen etwas weiter aufräumen (z. B. die Tags entfernen, die sich nicht auf statistische Konzepte beziehen, wie z. B. Software-Tags, im obigen Graphen ist dies bereits für den Tag 'r' der Fall) und die visuelle Darstellung verbessern, aber ich vermute dass dieses bild oben schon einen schönen ausgangspunkt zeigt.
R-Code:
Hierarchische Zweige
Ich glaube, dass diese Art von Netzwerkgraphen auf einige der Kritikpunkte in Bezug auf eine rein verzweigte hierarchische Struktur zurückzuführen ist. Wenn Sie möchten, können Sie vermutlich ein hierarchisches Clustering durchführen, um eine hierarchische Struktur zu erzwingen.
Nachfolgend finden Sie ein Beispiel für ein solches hierarchisches Modell. Man müsste immer noch die richtigen Gruppennamen für die verschiedenen Cluster finden (aber ich glaube nicht, dass diese hierarchische Gruppierung die richtige Richtung ist, also lasse ich sie offen).
Das Abstandsmaß für das Clustering wurde durch Ausprobieren ermittelt (Anpassungen vornehmen, bis die Cluster schön aussehen).
Geschrieben von StackExchangeStrike
quelle
Eine einfache Möglichkeit, Ihre Frage zu beantworten, besteht darin, die allgemeinen Klassifizierungstabellen nachzuschlagen. Beispielsweise wird die 2010 Mathematics Subject Classification von einigen Veröffentlichungen zur Klassifizierung von Arbeiten verwendet. Diese sind relevant, weil so viele Autoren ihre eigenen Arbeiten klassifizieren.
Es gibt viele Beispiele für ähnliche Klassifikationen, z. B. die Klassifikation von arxiv oder die UDK (Universal Decimal Classification) des russischen Bildungsministeriums, die für alle Veröffentlichungen und Forschungsarbeiten weit verbreitet ist.
Ein weiteres Beispiel ist das JEL Claasification System der American Economic Association. Rob Hyndmans Artikel " Automatische Zeitreihenprognose: Das Prognosepaket für R. " Es ist nach JEL als C53, C22, C52 klassifiziert. Hyndman hat jedoch einen Grund, die Baumklassifikationen zu kritisieren. Ein besserer Ansatz könnte das Markieren sein, z. B. lauten die Schlüsselwörter in seiner Arbeit: "ARIMA-Modelle, automatische Vorhersage, exponentielle Glättung, Vorhersageintervalle, Zustandsraummodelle, Zeitreihen, R." Man könnte argumentieren, dass dies eine bessere Methode zur Klassifizierung der Papiere ist, da sie nicht hierarchisch sind und mehrere Hierarchien aufgebaut werden könnten.
@whuber machte darauf aufmerksam, dass einige der neuesten Fortschritte, wie das maschinelle Lernen, in den aktuellen Klassifikationen nicht statistisch erfasst werden. Schauen Sie sich zum Beispiel den Artikel " Deep Learning: Eine Einführung für Angewandte Mathematiker " von Catherine F. Higham und Desmond J. Higham an. Sie klassifizierten ihr Papier unter der oben genannten MSC als 97R40, 68T01, 65K10, 62M45. Dazu gehören neben Statistiken auch Informatik, Mathematik und numerische Analyse
quelle
Ein Weg, um das Problem anzugehen, ist der Blick auf Zitations- und Mitautoren-Netzwerke in Statistik-Journalen wie Annals of Statistics, Biometrika, JASA und JRSS-B. Dies wurde gemacht von:
Sie identifizierten Gemeinschaften von Statistikern und benannten die Gemeinschaften anhand ihres Domänenverständnisses als:
Das Papier enthält eine detaillierte Diskussion der Gemeinschaften zusammen mit der Zerlegung der größeren in weitere Untergemeinschaften.
Dies ist möglicherweise nicht die vollständige Antwort auf die Frage, da es sich eher um die Bereiche der Statistikerforschung handelt als um alle Bereiche, auch solche, die nicht mehr aktiv sind. Hoffentlich ist es trotzdem hilfreich. Natürlich gibt es noch andere Vorbehalte (wie zum Beispiel nur die Berücksichtigung dieser vier Zeitschriften), die in der Veröffentlichung näher erläutert werden.
quelle
Ich sehe viele erstaunliche Antworten, und ich weiß nicht, wie eine bescheidene, selbst gemachte Klassifizierung erhalten werden kann, aber ich kenne kein komplettes Buch aller Statistiken, um die Zusammenfassung von zu zeigen, und ich denke, dass, als @ Brillant kommentiert, kann eine Klassifizierung eines Studienfachs sinnvoll sein. Also, hier ist mein Schuss:
Natürlich ist das zu simpel, es ist nur dazu gedacht, jemandem eine Idee zu vermitteln, der das Gebiet kaum kennt. Jeder von uns hier weiß mit Sicherheit, dass es eine Menge Methoden zwischen den Kategorien gibt, viele andere, die ich nicht kannte. ' t Liste, weil sie weniger berühmt sind oder weil ich es einfach vergessen habe. Hoffe du magst es.
quelle
Eine Möglichkeit, diese Informationen zu organisieren, besteht darin, ein gutes Buch zu finden und sich das Inhaltsverzeichnis anzusehen. Dies ist ein Paradoxon, weil Sie speziell nach Statistiken gefragt haben , während die meisten Texte für Einsteiger mit Abschluss zum Thema Statistik und Wahrscheinlichkeitstheorie zusammen sind. Ein Buch, das ich über Regression lese, hat jetzt das folgende Inhaltsverzeichnis:
Binäre Datenmodelle
Allgemeine Regressionsmodelle
(Die übrigen Abschnitte befassen sich mit Mathematik und Wahrscheinlichkeitstheorie.)
quelle