Data Mining-Techniken in Obamas Kampagne

10

Ich bin auf diesen Artikel über das Data Mining-Team in Obamas Wiederwahlkampagne gestoßen. Leider ist der Artikel über die tatsächliche Maschinerie der statistischen Algorithmen sehr verschwommen. Es klang jedoch so, als ob die allgemeinen Techniken in den Sozial- und Politikwissenschaften bekannt wären. Kann mich jemand auf (Übersichts-) Literatur zu solchen Techniken verweisen, da dies nicht mein Fachgebiet ist?

fabelhaft
quelle

Antworten:

16

Dieser Bereich wird als Mikrotargeting bezeichnet (wenn Sie danach googeln möchten). Kampagnen sind ziemlich geheimnisvoll über ihre Werkzeuge und Verfahren, so mein Wissen gibt es nicht so viel Arbeit veröffentlicht , außer Hal Malchow der politischen Targeting (2008) oder Grün & Gerber (2008) gehen Sie die Abstimmung: Wie Wahlbeteiligung erhöhen (die letzteren Angebote mehr mit sozialwissenschaftlichen Aspekten wie den effektiven Anzeigen und dergleichen).

In technischeren Fragen ist die Literatur noch knapper, aber siehe z. B. Murray & Scime (2010) , das Political Analysis Paper von Imai & Strauss (2011) ( Postprint ) oder das kürzlich erschienene Annals of Applied Statistics Paper von uns Rusch, Lee, Hornik, Jank & Zeileis (2013) ( Postprint ). Allen gemeinsam ist, dass sie Data-Mining-Techniken verwenden, die meist auf Bäumen basieren.

Murray & Scime verwenden Standardklassifizierungsbäume wie CART.

Rusch et al. Verwenden Sie Klassifizierungsbäume, logistische Modelle und eine Mischung aus Bäumen und logistischer Regression. Sie verwenden auch (unter anderem) zufällige Wälder, neuronale Netze, Support-Vektor-Maschinen und Bayesian Additive Regression-Bäume, um sie mit ihren Baumhybriden zu vergleichen, wie in der Gegenerwiderung zum Artikel beschrieben . Ihre Hybridbäume sind mit den anderen Methoden in ihren Datensätzen vergleichbar und bieten eine verbesserte Interpretierbarkeit (wir teilen auch ihren Code und ihre Daten).

Imai & Strauss ist insofern interessant, als sie einen umfassenden entscheidungstheoretischen Rahmen für eine optimale Kampagnenplanung bieten, nicht nur Tools für das Mikrotargeting wie die anderen. Daher konzentrieren sie sich sehr auf Aspekte der operativen Forschung, um das Beste aus jedem Dollar herauszuholen, der in die Kampagne gesteckt wird. In ihrem Rahmen, in dem sie statistische Techniken für Mikrotargeting und Wahlbeteiligungsschätzung einsetzen, stützen sie sich wiederum auf Klassifizierungsbäume.

Es scheint also ein gewisser Konsens darüber zu bestehen, dass die Verwendung von baumbasierten Methoden in diesem Bereich gut funktioniert.

Momo
quelle