Modellierung der Mietpreise - welche Interpolationsmethode ist anzuwenden?

13

Ich habe nationalen Datensatz von ~ 1,4 Millionen Haushalten. Dort habe ich Informationen über Miete, Größe (Anzahl der Zimmer und m2) und einige zusätzliche Merkmale der einzelnen Haushalte.

Ich möchte diese Daten verwenden, um Mietpreisoberflächen für das ganze Land zu erstellen und diese Informationen als Proxy für die Schätzung der Werte der verbleibenden 1,5 Millionen Haushalte zu verwenden, die Eigentum sind oder über keine Mietinformationen verfügen.

Einige Fragen hier:

Ist ein solcher Ansatz überhaupt für diese Art von Problem geeignet?

Welche Interpolationsmethode ist hier am besten geeignet?

Wäre es auch möglich, Informationen über beispielsweise die Größe des Haushalts zu berücksichtigen?

Ich bin auf ArcGIS 9.3 mit ArcInfo-Lizenz.

radek
quelle
1
Es scheint, als müssten Computer Aided Mass Appraisal (CAMA) -Systeme etwas Ähnliches tun. Ich frage mich, wie sie damit umgehen. en.wikipedia.org/wiki/Computer_Assisted_Mass_Appraisal
Kirk Kuykendall

Antworten:

10

Die Idee ist gut, aber die vorgeschlagene Implementierung ist möglicherweise zu simpel, um glaubwürdig zu sein. Mieten sind Eigentum von Wirtschaftssystemen. Abgesehen davon, dass sie vom Standort beeinflusst werden, hängen sie in wichtiger Weise mit anderen wirtschaftlichen Variablen zusammen: dem Zustand der lokalen (und nationalen) Wirtschaft, den lokalen Immobilienpreisen, der Verfügbarkeit von Kapital, den Beschäftigungsquoten usw. Um gute Arbeit zu leisten, ist ein ökonometrisches Modell erforderlich . Es kann von Vorteil sein, einige räumliche Verzögerungsbedingungen zu haben , aber bevor solche Komplikationen in Betracht gezogen werden, müssen Sie viele dieser wirtschaftlichen Kovariaten einbeziehen.

Allerdings hängt Ihre Fähigkeit zum Erfolg von den Beziehungen zwischen den Daten ab, die Sie haben, und den Mieten, die Sie vorhersagen möchten. Wenn Ihre Daten eine repräsentative Stichprobe des gesamten Landes darstellen und geografisch verteilt sind - stellen Sie sich Häuser als Rosinen in einem Cookie vor und Sie haben Daten zu jeder anderen Rosine im Cookie -, kann ein relativ einfaches Modell ausreichen. Wenn Ihre Daten geografisch konzentriert sind - möglicherweise haben Sie Informationen zu Rosinen auf der rechten Seite des Cookies und möchten Prognosen für die Rosinen auf der linken Seite erstellen -, ist das Problem schwieriger.

Ein guter Ausgangspunkt wäre, ein herkömmliches lineares ökonometrisches Mietmodell an die Haushaltsmerkmale und die räumlichen Bruttomerkmale (z. B. Steuerpolitik des Bundesstaates oder des Landkreises) anzupassen, die Residuen zu berechnen und die Residuen räumlich zu untersuchen (mithilfe von Variographie und Glättung des räumlichen Kernels) , etc) um die geografischen Effekte zu erfassen.

Passende Software ist als Add-On zu R erhältlich .

whuber
quelle
@whubber Der Link zum Dokument, das die Variographie beschreibt, scheint tot zu sein. Gibt es eine Chance, es zu aktualisieren?
Radek
1
Danke, @radek. Es ist überraschend schwierig, eine einführende und dennoch genaue Darstellung von Variografie im Internet zu finden, die nicht nur ein Softwarehandbuch ist. Ich habe kürzlich eine Doktorarbeit gefunden, die - gemessen an ihrer Zusammenfassung und Einführung - klar und gründlich zu sein scheint und von einem relativ elementaren Punkt ausgeht.
whuber
7

Als sehr sanfte Einführung in Themen zur räumlichen Regression empfehle ich dringend, das GeoDa-Arbeitsbuch zu lesen (Kapitel 22 bis 25 sind am interessantesten). Auch wenn Sie die Software nicht verwenden möchten, bietet sie einen umfassenden Überblick über die räumliche Regression.

Werden die in ArcMap integrierten Regressionsfunktionen so viele Daten verarbeiten (nicht, dass Software mit so vielen Punkten Schwierigkeiten haben würde?)

Andy W
quelle
3
(+1) 1,4 Millionen Punkte sind kein Problem für die Regression. (Der Aufwand bei Algorithmen für kleinste Fehlerquadrate ist beispielsweise in der Regel proportional zum Würfel der Anzahl der Variablen. Für die Erstellung der Gleichungen ist nur ein schneller Scan des Datensatzes erforderlich.) Das eigentliche Problem besteht darin, dass 1,4 Millionen Fälle ein reichhaltiges und umfangreiches Ergebnis haben Detaillierter Aufbau: Eine gute Analyse wäre äußerst arbeitsintensiv. (Ich bin sicher, dieser Datensatz könnte eine Menge wirtschaftswissenschaftlicher Dissertationen hervorbringen.) Der Trick besteht daher darin, genau so viel Arbeit zu leisten, wie für die jeweilige Aufgabe ausreichend genaue und vertretbare Antworten zu erhalten.
whuber
3

Ich habe ähnliche Arbeiten für Immobilienpreise mit hedonischer Modellierung gesehen. Beispiele finden Sie unter http://scholar.google.com/scholar?hl=de&q=hedonic+price+geography .

Ian Turton
quelle
2
(+1) Ich stimme zu, dass die Literatur zu hedonischen Modellen der Immobilienpreisgestaltung weitgehend auf diese Frage anwendbar ist. Ich habe mich daran gewöhnt, es vorzuschlagen, da eine Person, die mit Regression nicht vertraut ist, die Arbeit all dieser Ökonomen als entmutigend empfinden könnte (ich weiß, dass ich es manchmal tue!) von Interesse.
Andy W