Ist ArXiv in der Statistik-Community beliebt?

25

Ich weiß, dass die Physik- und Mathematik-Community sehr auf ArXiv steht, aber was ist mit der Statistik-Community? Ist es üblich, dort vor der Einreichung zu posten?

StasK
quelle
Ich habe dort noch nie gepostet und kann mich auch nicht erinnern, dort nach Papieren gesucht zu haben.
Christoph Hanck
@DeepNorth ja, das wäre interessant. Ich frage beide aus Neugier und weil ich kürzlich einen Entwurf auf ArXiv gepostet habe.
1
Ja; einige von uns schauen sich zumindest zeitweise arXiv an. Ich mache es, wenn ich kann oder wenn mich jemand dorthin verweist und ich oft Leute mit Papieren dort verbinde.
Glen_b
3
Definieren Sie "Statistiken". In dem Bereich, in dem ich arbeite, brachten meine wohl naiven Sucher nach "komplexen Umfragen" und "endlichen Populationen" 2 bzw. 42 Ergebnisse auf arXiv. Die Abteilung für Umfrageforschungsmethoden der American Statistical Association veranstaltet jedes Jahr rund 40 Sitzungen auf den gemeinsamen statistischen Tagungen, jeweils zwischen 1 und 3 in einem Zeitraum von vier Tagen der Konferenz, und erstellt dementsprechend mindestens hundert Proceedings-Papiere. Soweit ich das beurteilen kann, schafft das nichts für arXiv.
StasK

Antworten:

19

Ja, Arxiv ist in der Statistik und in der Data-Science-Community beliebt.

Da sich die Welt der Statistik- und Datenwissenschaft täglich weiterentwickelt, ist es für Statistiker und Datenwissenschaftler wichtig, sich mit den neuesten Ereignissen, Techniken und Algorithmen vertraut zu machen.

Es ist vielleicht nicht so populär wie in der Physik, aber es hat seinen Anteil an der Bedeutung in der datenreichen Welt.

Vielleicht interessieren Sie sich für Gitxiv , das aktuelle Forschungsergebnisse mit den entsprechenden Open-Source-Codes / Bibliotheken kombiniert .

Dawny33
quelle
3
+1 für den Link zu Gitxiv ... Ich werde einen Blick darauf werfen. Überprüfen Sie regelmäßig ArXiv oder abonnieren Sie eine seiner E-Mail-Listen?
2
Gern geschehen. Gitxiv hat die Welt der Forschung der Welt der Statistik und der Informatik ein Stück näher gebracht. Ein großes Lob an diese Jungs. Nein, ich abonniere die Mailinglisten nicht, aber da die meisten Artikel zu Maschinellem Lernen und Analytik dort zu finden sind, überprüfe ich sie jede Woche.
Dawny33
3
Es wäre besser, wenn Sie Belege beifügen würden. Jetzt ist es nur ein Wort "Ja" und der Rest ist nicht informativ (aber Gitxiv ist interessant, danke für die Erwähnung).
Richard Hardy
19

Ich werde eine endgültige, evidenzbasierte Antwort geben. Die Antwort ist ja.

Betrachten Sie die Google Scholar-Metriken für Wahrscheinlichkeit und Statistik, die 10 wichtigsten Quellen nach h5-Index:

    Publication                               h5-index  h5-median
1.  Journal of Econometrics                         62  93
2.  The Annals of Statistics                        58  81
3.  arXiv Statistics Theory (math.ST)               57  80
4.  Journal of Statistical Software                 53 113
5.  arXiv Probability (math.PR)                     53  65
6.  arXiv Methodology (stat.ME)                     48  69
7.  Journal of the American Statistical Association 48  66
8.  Statistics in Medicine                          42  62
9.  Computational Statistics & Data Analysis        40  51
10. Journal of Business & Economic Statistics       39  67

Hinweis: Diese Liste basiert nicht auf der Anzahl der Veröffentlichungen, sondern auf dem Zitierindex .

Googles Zitierindex wird so populär wie Scopus und Reuters (ok, ich habe keinen Beweis für diese Aussage), also ist meine Antwort so objektiv wie es nur geht.

Vergleichen Sie dies mit der Liste von Scimagojr.com über Statistik und Wahrscheinlichkeit:

    Title   Type    SJR H index Total Docs. (2014)  Total Docs. (3years)    Total Refs. Total Cites (3years)    Citable Docs. (3years)  Cites / Doc. (2years)   Ref. / Doc. Country
1   Annals of Mathematics   j   Q1  8,551   72  46  209 1.572   647 207 3,05    34,17   US
2   Vital and health statistics. Series 10, Data from the National Health Survey    k   Q1  7,801   30  4   7   55  125 7   16,33   13,75   US
3   Journal of the Royal Statistical Society. Series B: Statistical Methodology j   Q1  6,148   90  45  99  1.507   547 94  3,09    33,49   GB
4   Annals of Statistics    j   Q1  5,602   103 64  296 2.099   809 287 2,25    32,80   US
5   Journal of Statistical Software j   Q1  5,003   64  67  220 2.540   1.364   220 3,91    37,91   US
6   Journal of the American Statistical Association j   Q1  4,162   123 106 408 3.501   907 373 1,85    33,03   US
7   Probability Surveys j   Q1  3,645   22  1   20  84  46  19  2,73    84,00   US
8   Bioinformatics  j   Q1  3,576   248 809 2.145   18.801  11.329  2.089   4,69    23,24   GB
9   Journal of Business and Economic Statistics j   Q1  3,496   66  58  146 1.464   384 139 2,21    25,24   US
10  Biometrika  j   Q1  3,342   83  58  233 1.485   369 229 1,28    25,60   GB

Wie Sie sehen, gibt es eine gute Überschneidung mit der Top-10-Liste von Google Scholar. Die letztere Liste basiert ebenfalls auf dem h-Index, ist jedoch nicht das Zitat von Google. Dies bestätigt nur die frühere Tabelle und die daraus abgeleiteten Schlussfolgerungen: arXiv ist bei Statistikern in der Wissenschaft beliebt .

SSRN ist ein weiterer Ort, um die Preprints zu speichern. Es ist beliebt bei Ökonomen.

Aksakal
quelle
+1 - Großartige Arbeit mit Google-Metriken! Der h-Index legt es definitiv dort auf.
@Bey, eins ist zu beachten: Open Access Bewegung. arXiv ist der Ort, an dem die Leute ihre Preprints ablegen, so begann es in der Physik. Sie werden also zum Beispiel dasselbe Papier in arXiv sehen und später in Phys Rev. So wurde arXiv ursprünglich geschaffen, um die Forschung schneller zu verbreiten. Gute Papiere erscheinen normalerweise nicht ausschließlich auf arXiv.
Aksakal
Ja. Normalerweise zitiere ich einen Artikel, den ich auf ArXiv finde, nur, wenn ich ihn auch in einem Peer-Review-Journal finde. Mein Papier ist da, während es nach Ablauf der Sperrfrist einer Überprüfung unterzogen und mit dem akzeptierten Vordruck aktualisiert wird (vorausgesetzt, es wird nicht abgelehnt).
@Bey, während wir gerade dabei sind, gibt es zwei andere Stellen, an denen Sie Ihre Preprints ablegen können: RePec und SSRN. Die
Ökonomen
14

Es ist keine Frage der persönlichen Meinung. Schauen wir uns einige Zahlen zu Begriffen auf arXiv-Seiten an (einige zufällige Google-Abfragen mit wenigen domänenspezifischen Begriffen):

Cross Validation Site: arxiv.org kehrt zurück

Ungefähr 17.800 Ergebnisse

monte carlo site: arxiv.org kehrt zurück

Ungefähr 187.000 Ergebnisse

Sampling-Site: arxiv.org kehrt zurück

Über 141.000 Ergebnisse

Vorhersage-Website: arxiv.org kehrt zurück

Ungefähr 11.300 Ergebnisse

Regressionsseite: arxiv.org kehrt zurück

Ungefähr 51.100 Ergebnisse

BEARBEITEN

Wie @Scortchi bemerkte, veröffentlicht arXiv seine eigenen Statistiken. Die Statistikkategorie wird in den Berichten der letzten drei Jahre wie folgt angezeigt:

year submissions % submissions
2014 2025        2.2% 
2013 1602        1.7%
2012 1284        1.5%

Dies stellt jedoch möglicherweise nicht den gesamten Inhalt der veröffentlichten Artikel dar, da einige von ihnen möglicherweise in hohem Maße mit Statistiken zusammenhängen, jedoch als andere Domäne gekennzeichnet sind (z. B. als Mathematik oder CS ).

Auch Xi'ans Blog könnte als Fallstudie dienen. Er schreibt viel über Bayesianische Statistiken und erwähnt oft überlieferte Artikel (mit einem eigenen Tag ).

Es scheint auch, dass wir "arXiv" bei CrossValidated in bisher 689 Posts und Kommentaren erwähnt haben (einschließlich hier).

Macht es das populär oder nicht? Trotzdem schwer zu sagen, aber auf jeden Fall wurden Tausende von statistischen Artikeln auf arXiv veröffentlicht, und seine Popularität wächst.

Tim
quelle
3
Oder zumindest Tausende von
Artikeln
@ Glen_b Ja, es ist eine Frage der Stichwörter, aber ich sehe keinen besseren Weg, um zu überprüfen, ob es "beliebt" ist.
Tim
4
'Statistik' ist ein Themenbereich von arXiv - mit 7.711 Einreichungen bis Ende 2014 sind dies 0,9% der Gesamtzahl. arxiv.org/help/stats/2014_by_area/index
Scortchi - Monica wiederherstellen
@Scortchi Ich habe noch nie so tief in diese Seite gegraben, danke!
Tim
+1 :) Ich habe mir diese Frage nicht als Analyseübung vorgestellt ... aber Sie haben einen Weg gefunden, um an sie heranzukommen ... das ist sehr cool :) Ich würde von den Leuten auf dieser Site nicht weniger erwarten! Ich würde sagen, basierend auf @Aksakal und Ihrer Analyse ist ArXiv einigermaßen gut für Statistiken abonniert :-)
8

Alle vom Institut für Mathematische Statistik (IMS) herausgegebenen Zeitschriften - darunter The Annals of Statistics (eine der wichtigsten statistischen Zeitschriften), The Annals of Applied Statistics usw. - ermutigen die Autoren ausdrücklich, Vorabdrucke auf arXiv und zu erstellen Achten Sie außerdem darauf, dass auch arXiv mit Postprints versehen wird. Mir ist eigentlich kein Mathematik- oder Physikjournal bekannt, das Artikel auf arXiv hochlädt, wenn die Autoren dies nicht selbst getan hätten!

Das IMS fordert alle Mitglieder auf, ihre Artikel auf arXiv zu veröffentlichen.

( http://www.imstat.org/publications/arxiv.html )

Alle IMS-Artikel ab 2004 sowie die von Autoren veröffentlichten Artikel sind in einem Postprint-Format auf arXiv frei verfügbar.

ArXiv ist ein vollautomatisierter Open-Access-Server für das elektronische Archiv und die Verteilung von Forschungsartikeln, der der Cornell University gehört und von ihr betrieben wird und teilweise von NSF finanziert wird. Die Hauptgebiete sind Physik, Mathematik, nichtlineare Naturwissenschaften, Informatik und quantitative Biologie. Vor kurzem hat arXiv mit IMS und der Bernoulli-Gesellschaft zusammengearbeitet, um eine neue Statistikkategorie in der Mathematik zu eröffnen. Wir gehen davon aus, dass diese Kategorie irgendwann zu einem Top-Level-Archiv werden wird, das vergleichbar ist mit zB Mathematik und Physik.

( http://www.imstat.org/publications/eaccess.htm )

Amöbe sagt Reinstate Monica
quelle