Daten-APIs / Feeds sind als Pakete in R verfügbar

53

EDIT: Die Web - Technologien und Services CRAN Aufgabenansicht enthält eine viel umfassendere Liste der Datenquellen und APIs in R. Sie können eine Pull - Anforderung auf Github einreichen , wenn Sie ein Paket zur Aufgabe Ansicht hinzufügen möchten.


Ich erstelle eine Liste der verschiedenen Datenfeeds, die bereits in R eingebunden sind oder die einfach einzurichten sind. Hier ist meine erste Liste von Paketen, und ich habe mich gefragt, was ich sonst noch vermisse.

Ich versuche, diese Liste auf "Echtzeit" - oder "echtzeitnahe" Datenfeeds / APIs zu beschränken, bei denen sich die zugrunde liegenden Daten zwischen den Downloads ändern können. Es gibt viele Listen für statische Datensätze, für die nur ein Download erforderlich ist.

Diese Liste ist derzeit voreingenommen in Richtung Finanz- / Zeitreihendaten, und ich könnte etwas Hilfe gebrauchen, um sie auf andere Domänen auszudehnen.

Freie Daten:
Datenquelle - Package
Google Finance historische Daten - quantmod
Google Finance Bilanzen - quantmod
Yahoo Finance historische Daten - quantmod
Yahoo Finance historische Daten - tseries
Yahoo Finance aktuelle Optionen Kette - quantmod
Yahoo Finance historische Schätzungen des Analysten - fImport
Yahoo Finance aktuelle Schlüsselstatistiken - fImport - scheint gebrochen zu sein
OANDA historische Wechselkurse / Metallpreise - quantmod
FRED historische makroökonomische Indikatoren - quantmod
Weltbank historische makroökonomische Indikatoren - WDI
Google Trends historische Suchvolumen - RGoogleTrends
Google Text & Tabellen - RGoogleDocs
Google Storage - RGoogleStorage
Twitter - Twitter
Zillow - Zillow
New York Times - RNYTimes
US - Volkszählung 2000 - UScensus2000
infochimps - infochimps
Datamarket - rdatamarket - kostenloses Konto erfordert
Factual.com - factualR
Geocode - Adressen - RDSTK-Kartenkoordinaten
zu politischen Grenzen - RDSTK
Weather Underground - Roll your own
Google News - Rollen Sie Ihre eigene
Earth Sciences netCDF Daten - Rollen Sie Ihre eigene
Klimadaten - Bewegen Sie Ihre eigenen
öffentlichen Gesundheitsdaten - Rollen Sie Ihre eigene
OAI Harvester - Open Archives Initiative Mähdrescher
RAmazonS3 - S3 Amazon Speicherserver
Rflikr - Flikr api

Benötigt ein Abonnement:
Bloomberg - RBloomberg
LIM - LIM
Trades und Quotes von NYSE - RTAQ
Interactive Brokers - IBrokers

Zach
quelle
1
hängt davon ab, was Sie unter "einfach einzurichten" verstehen ... Ich habe eine Reihe von benutzerdefinierten Skripten, die "einfach einzurichten" sind
David LeBauer
2
Im Moment definiere ich "einfach einzurichten" als "das Paket existiert" oder "jemand hat eine Funktion zum Herunterladen der Daten gepostet / veröffentlicht"
Zach
Ich würde weiter definieren, dass "die Pakete existieren" als "das Paket befindet sich auf CRAN" oder "das Paket befindet sich auf R Forge", "das Paket befindet sich auf einem CRAN-ähnlichen öffentlichen Repository."
Zach
Ergänzung: Federal Register API (in Arbeit).
Fr.
Dieser Thread könnte Sie auch interessieren: Aktienkurs von Yahoo Finance in R importieren .
gung - Wiedereinsetzung von Monica

Antworten:

8
  1. Eine Anleitung zum Herunterladen von netCDF-Daten mit R finden Sie hier , einem gängigen Format zum Speichern von geowissenschaftlichen Daten, z. B. in Meeresgeodaten von OpenEarth oder Klimamodelltreibern und Vorhersagen von UCAR

  2. Mit rnpn (in Entwicklung) können Sie Daten aus dem National Phenology Network abrufen - einem Citizen Science-Projekt, mit dem Sie den Zeitpunkt der Begrünung, Blüte und des Alterns von Pflanzen verfolgen können. Siehe den Blog-Beitrag des Entwicklers .

  3. -obsolete- RClimate bietet Tools zum Herunterladen und Bearbeiten von Flatfile -Klimadaten (mit Tutorials, einschließlich hier -

  4. Laden Sie historische Finanzdaten mit herunter tseries::get.hist.quote

  5. Michael Samuels Dokumente zum Herunterladen von Gesundheitsdaten

  6. raster::getData Ermöglicht den Zugriff auf Klimavariablen über worldclim

David
quelle
Was sind "netCDF-Daten"?
Zach
@Zach NetCDF ist eine Art universelle strukturierte Methode zum Speichern großer Datensätze. Ein alternativer Ansatz basiert auf dem HDF5- Format.
Chl
@David (+1) Vielen Dank für den vierten Punkt!
Chl
Was ist mit RClimate passiert? Ich kann das Paket nirgendwo finden
Daniel Ryback
jetzt gibt es eine ncdf4-bibliothek auf r, um netcdf4 zu handhaben. Die Installation ist komplizierter als die von ncdf, aber die spätere ist meiner Meinung nach veraltet. Vor ein paar Jahren habe ich es sogar geschafft, netcdf4 mit Min GW64 zu installieren, damit dieses Paket unter Windows funktioniert auf seiner Website cirrus.ucsd.edu/~pierce/ncdf
Robin Girard
8

Es gibt ein Projekt zur Erstellung von R-Paketen mit diesem Ziel (R-Schnittstelle zu Echtzeit-APIs) namens rOpenSci , für das derzeit 18 Pakete verfügbar sind oder sich in der Entwicklung befinden. Einige (rnpn, rfishbase) sind bereits auf Ihrer Liste.

Tolle Liste! und vollständige Offenlegung - Ich bin Teil des rOpenSci-Projekts.

cboettig
quelle
1
  1. ONETr - Effiziente Interaktion mit der O * NET ™ -API , die Berufsbezeichnungsdaten des US-Arbeitsministeriums bereitstellt.
RunChiRun
quelle