Wie viele Informationen können Sie aus einem Namen gewinnen?

11

Ein Name: zuerst, möglicherweise eine Mitte und ein Nachname.

Ich bin gespannt, wie viele Informationen Sie aus einem Namen mithilfe öffentlich verfügbarer Datensätze abrufen können. Ich weiß, dass Sie mit US-Volkszählungsdaten mit einer geringen bis hohen Wahrscheinlichkeit (abhängig von der Eingabe) Folgendes erreichen können: 1) Geschlecht. 2) Rennen.

Facebook hat genau das verwendet, um mit angemessener Genauigkeit die rassistische Verteilung der Benutzer ihrer Website herauszufinden (https://www.facebook.com/note.php?note_id=205925658858).

Was kann noch abgebaut werden? Ich suche nichts Bestimmtes, dies ist eine sehr offene Frage, um meine Neugier zu stillen.

Meine Beispiele sind US-spezifisch, daher nehmen wir an, dass der Name der Name einer Person in den USA ist. Aber wenn jemand öffentlich verfügbare Datensätze für andere Länder kennt, bin ich auch mehr als offen für sie.

Ich bin mir nicht ganz sicher, ob dies der richtige Ort dafür ist. Wenn dies nicht der Fall ist, würde ich mich freuen, wenn mich jemand auf einen geeigneteren Ort hinweisen könnte.

Ich hoffe, das ist eine interessante Frage, und das ist der richtige Ort!


quelle
2
Vermutlich könnten Sie auch etwas über den geografischen Standort erfahren, wenn Sie die entsprechenden übereinstimmenden Daten erhalten könnten? Sie können auch Informationen über die Beliebtheit von Vornamen im Laufe der Zeit verwenden (Google "Babynamen-Assistent"), um Rückschlüsse auf das Alter zu ziehen ...
Ben Bolker
1
Ich habe die übertragene Frage mit dem Duplikat zusammengeführt.

Antworten:

12

Dies ist keine ernsthafte Antwort, aber ich habe mich gerade an etwas aus einem Buch erinnert, das ich vor einem Jahr gelesen habe. In Freakonomics gibt es ein Kapitel darüber , was Sie anhand des Namens über eine Person sagen können. Das Kapitel basiert auf dem Forschungsbericht des Autors Die Ursachen und Folgen von eindeutig schwarzen Namen

Ich glaube, ich habe in diesem Artikel einen Auszug oder eine Zusammenfassung davon gefunden

Die Daten zeigen, dass eine Person mit einem deutlich schwarzen Namen - sei es eine Frau namens Imani oder ein Mann namens DeShawn - im Durchschnitt ein schlechteres Lebensergebnis hat als eine Frau namens Molly oder ein Mann namens Jake. Aber es ist nicht die Schuld seines Namens. Wenn zwei schwarze Jungen, Jake Williams und DeShawn Williams, in derselben Nachbarschaft und unter denselben familiären und wirtschaftlichen Umständen geboren werden, haben sie wahrscheinlich ähnliche Lebensergebnisse. Aber die Art von Eltern, die ihren Sohn Jake nennen, leben nicht in der gleichen Nachbarschaft oder teilen die wirtschaftlichen Umstände mit der Art von Eltern, die ihren Sohn DeShawn nennen. Und deshalb wird ein Junge namens Jake im Durchschnitt mehr Geld verdienen und mehr Bildung erhalten als ein Junge namens DeShawn. DeShawn '


quelle
4

Aus dem Vornamen werden Region, Alter und Immigrantenstatus der ersten Generation vorhergesagt. Aus dem Nachnamen können Sie den geografischen Standort des ursprünglichen Patronyms vorhersagen. Für den vollständigen Namen können Sie den sozialen und wirtschaftlichen Status vorhersagen (Thurston Howell III).

fgregg
quelle
+1 nur für die erste Erwähnung eines Gilligan's Island-Charakters auf dieser Seite.
Rolando2
4

Eine weitere der größten Quellen für Familiendaten ist die Reihe von Genealogie-Sites. Ich denke, die meisten westlichen Menschen werden wahrscheinlich von einem entfernten oder sonstigen Familienmitglied in einigen von ihnen aufgeführt, und jede solche Aufnahme wird mit einem normalerweise umfassenden Stammbaum versehen, der Orte, Geburtsdaten usw. enthält. Sehr informativ.

Wenn Sie diese Daten mit Freundesdiagrammen in Facebook abgleichen, da die Leute dazu neigen, Geschwister / Cousins ​​(und gelegentlich Eltern / Kinder) hinzuzufügen, und dann die Standortdaten mit Wahlrollen und Verzeichnissen verwenden, können Sie Personen in der Regel sogar mit gebräuchlichen Namen identifizieren. und erhalten eine überraschend große Menge an Daten über sie.


quelle
3

Das letzte Kapitel von Freakonomics (2005, Steven D. Levitt und Stephen J. Dubner) enthält eine faszinierende Diskussion über Namen, insbesondere in Bezug auf den sozioökonomischen Status und die Rasse.

Sie haben eine Liste von Vornamen, die möglicherweise gut mit der Analyse der Nachnamen durch FB korrelieren oder nicht. Sie beschreiben auch, wie sich die Namenswahl diachron (im Laufe der Zeit) ändert.

Wer weiß - der Auswahlname der Eltern ist möglicherweise genauer als das, was die Leute über die Volkszählung berichten.

rajah9
quelle
3

Sie haben oben viele gute Vorschläge, daher erwähne ich nur eine interessante Anekdote. Ein Sommerstudent (heute ein bekannter Informatiker) in einem Unternehmensforschungslabor (das namenlos bleiben soll) untersuchte die Daten aus dem Online-Telefonverzeichnis des Unternehmens und erstellte ein Vorhersagemodell für die Gehaltsstufe unter Verwendung von Zeichen n-Gramm aus Namen. Der stärkste Prädiktor war, dass ez_ eine niedrigere Gehaltsstufe anzeigte, ein Ergebnis, von dem ich glaube, dass er nicht ermutigt wurde, darüber zu sprechen ...

DavidDLewis
quelle
2

Sie könnten wahrscheinlich herausfinden:

  1. Beruf und möglicherweise Berufserfahrung, wenn man an beruflichen Diskussionen teilnimmt (der aktuelle Job kann normalerweise entweder über den Domainnamen in der E-Mail oder in der Unterschrift ermittelt werden, die Suche würde auch frühere aufdecken).
  2. Verwandte, wenn man sich in sozialen Netzwerken profiliert.
  3. Aktueller Standort, zumindest bis zur Stadt.
  4. Ethnischer Hintergrund, wenn man einen bestimmten Namen hat (dh jemand namens "Lubomir" ist wahrscheinlich mit einem der slawischen europäischen Länder usw. verbunden).
  5. Geburtsdatum aus sozialen Netzwerken - Menschen neigen dazu, einer Person zu oder um ihr Geburtsdatum zu gratulieren, und wenn Sie Glück haben, erhalten Sie auch das Jahr, in dem man 25, 30, 35 usw. wird, da einer der Glückwünsche es wahrscheinlich erwähnen würde wenn nicht die betreffende Person.
  6. Bildungshintergrund - von LinkedIn usw.
  7. Hobbys, Lieblingssportmannschaften usw.
  8. Wenn man ein Tierliebhaber ist, hat er wahrscheinlich auch alle seine Haustiere in den sozialen Netzwerken.

Was übrigens bedeutet, dass Sie niemals etwas aus der obigen Liste für Ihre Passwörter, geheimen Fragen usw. verwenden sollten.


quelle
Was ist mit Leuten, die den gleichen Namen haben wie Sie? Es gibt eine Reihe von "Dean Harding" da draußen, einer von ihnen war sogar ein Profifußballer! Das "DeanHarding" auf Twitter bin nicht ich, es gibt Hunderte von "Dean Harding" auf Facebook, etc etc ...
Das hängt natürlich vom Zufall ab. Normalerweise können Sie herausfinden, welches es ist, nach Beruf, Ort usw., obwohl ich Fälle gesehen habe, in denen 3 Personen mit demselben vollständigen Namen, demselben Beruf und ungefähr in derselben Gegend lebten. Dann wird es natürlich schwieriger :)
2

Darden und Robinson (1976) versuchten, eine sprachliche Struktur zu finden, die die Assoziationen der Menschen über die Vornamen der Männer lenkt. Sie baten zwei Gruppen von Fächern (Soziologiestudenten und Marineoffiziere), eine Reihe gebräuchlicher amerikanischer Namen anhand semantischer Unterschiede wie weich-zäh, gemein-edel und Stadt-Land zu bewerten. Sie fragten auch nach Ähnlichkeitsurteilen zwischen den verschiedenen Namenspaaren und korrelierten zur Validierung die Mittelwerte aus den semantischen Differentialen mit den Dimensionen, die sie sowohl in Drei- als auch in Vier-D-Lösungen unter Verwendung des TORSCA-MDS-Verfahrens fanden.

Die Autoren fanden heraus, dass ihre 3-D-Lösung in etwa dem klassischen Trio von Aktivierung, Bewertung und Wirksamkeit von Osgood entspricht. In vier Dimensionen passte der Raum etwas besser zu den Daten, und hier interpretierten sie die Struktur als abhängig von „Charakter“, „Reife“, „Geselligkeit“ und „Männlichkeit“, obwohl diese Skalen nicht annähernd so gut definiert zu sein scheinen wie die Autoren vorgeschlagen. Ein überraschender Befund aus der Studie war, dass zumindest für diese beiden kleinen Stichproben (n = 83 und 21) keine Dimension auftrat, die der Unterscheidung zwischen Vorname und Spitzname entsprach.

Darden, DK und Robinson, IE (1976). Mehrdimensionale Skalierung der Vornamen von Männern: Ein soziolinguistischer Ansatz. Sociometry, 39 , 4, 422 & ndash; 431.

rolando2
quelle
1

Die Menge an Informationen, die gefunden werden kann, variiert stark, von Rasse und Geschlecht bis zu allen Arten von persönlichen Informationen. Ihre beste Wahl, um die Informationen zu erhalten, sind Websites sozialer Netzwerke wie Facebook, da diese im Allgemeinen mehr Informationen liefern als Cencus-Datenbanken.


quelle
1

Abhängig von den verwendeten Quellen können Sie eine Vielzahl von Informationen erhalten. Volkszählungsdaten sind offensichtlich. Sie können auch Informationen von Facebook, MySpace und anderen sozialen Netzwerken erhalten. Sie könnten wahrscheinlich auch öffentliche Nachrichtenarchive nach Erwähnungen ihres Namens durchsuchen. Vielleicht sogar die ungeklärten Grundstücke, die einige Staaten haben.

Wenn Sie ein Beispiel aus der Praxis sehen möchten, was getan werden kann, besuchen Sie pipl.com


quelle
Können Sie uns sagen, wo (überall auf der Welt) wir Volkszählungsdaten mit Namen finden können ?
whuber
1

Sie können nach Abschlüssen, Führerschein und Polizeiaufzeichnungen suchen (ist es die richtige Übersetzung?). Bei Facebook finden Sie Informationen zu Hobbys, Sport und Musik. Sie können auch nach dem Social-Media-Anteil anderer Benutzer mit einem bestimmten Namen suchen. (Ich würde mich für diese Ergebnisse interessieren)

lcrmorin
quelle
0

Wenn Sie etwas über den Standort der Person wissen, sind Wählerregistrierungsdatenbanken eine Informationsquelle. Viele der Wählerregistrierungsdatenbanken sind verfügbar (gegen Gebühr; es gibt Unternehmen, die sie kaufen und gegen eine Gebühr Online-Abfragezugriff auf sie gewähren). Die Wählerregistrierungsdatenbank enthält möglicherweise die Adresse und / oder das Geburtsdatum der Person. Mit diesen Informationen können Sie die Person möglicherweise in anderen Datenbanken nachschlagen.

Es gibt jedoch Grenzen, wie viel dies hilft. Dies kann hilfreich sein, wenn Sie die Stadt oder den Landkreis kennen, in der die Person lebt, und wenn ihr Name ziemlich ungewöhnlich ist. Aber wenn dies ein gebräuchlicher Name ist oder Sie nicht wissen, wo sie leben, wird es Ihnen wahrscheinlich nicht helfen.

DW
quelle
0

Eine der größten Quellen für öffentlich zugängliche Daten, einschließlich vieler anderer nützlicher Attribute, ist das Büro der Bezirksschreiber für Aufzeichnungen über Eigentumsrechte. Das Problem bezieht sich auf das Zusammenführen aller Daten. Einige Staaten stellen eine zentrale Datenbank bereit, andere jedoch nicht.

NetConstructor.com
quelle