Ich versuche derzeit, "Name" -Felder aus zwei separaten Datenquellen abzugleichen. Ich habe eine Reihe von Namen, die nicht exakt übereinstimmen, aber nahe genug sind, um als übereinstimmend angesehen zu werden (Beispiele unten). Haben Sie Ideen, wie ich die Anzahl der automatisierten Übereinstimmungen verbessern kann? Ich entferne bereits mittlere Initialen aus den Übereinstimmungskriterien.
Aktuelle Spielformel:
=IFERROR(IF(LEFT(SYSTEM A,IF(ISERROR(SEARCH(" ",SYSTEM A)),LEN(SYSTEM A),SEARCH(" ",SYSTEM A)-1))=LEFT(SYSTEM B,IF(ISERROR(SEARCH(" ",SYSTEM B)),LEN(SYSTEM B),SEARCH(" ",SYSTEM B)-1)),"",IF(LEFT(SYSTEM A,FIND(",",SYSTEM A))=LEFT(SYSTEM B,FIND(",",SYSTEM B)),"Last Name Match","RESEARCH")),"RESEARCH")
quelle
Ich würde versuchen, diese Liste (nur englischer Abschnitt) zu verwenden, um die üblichen Verkürzungen auszusortieren.
Außerdem möchten Sie möglicherweise eine Funktion verwenden, die Ihnen genau sagt, wie "nahe" zwei Zeichenfolgen sind. Der folgende Code kam von hier und dank Grinsen .
Dadurch erfahren Sie, wie viele Einfügungen und Löschungen an einer Zeichenfolge vorgenommen werden müssen, um an die andere zu gelangen. Ich würde versuchen, diese Zahl niedrig zu halten (und Nachnamen sollten genau sein).
quelle
Ich habe eine (lange) Formel, die Sie verwenden können. Es ist nicht so gut geschliffen wie die oben genannten - und funktioniert nur für den Nachnamen und nicht für einen vollständigen Namen -, aber Sie finden es möglicherweise nützlich.
Wenn Sie also eine Kopfzeile haben und
A2
mitB2
dieser vergleichen möchten , platzieren Sie diese in einer anderen Zelle in dieser Zeile (z. B.C2
) und kopieren Sie sie bis zum Ende.Dies wird zurückkehren:
Danach erhalten Sie einen Grad von 0 ° bis 6 °, abhängig von der Anzahl der Vergleichspunkte zwischen den beiden. (dh 6 ° vergleicht besser).
Wie ich schon sagte ein bisschen rau und bereit, bringt dich aber hoffentlich in ungefähr den richtigen Ballpark.
quelle
War auf der Suche nach etwas Ähnlichem. Ich habe den Code unten gefunden. Ich hoffe, dies hilft dem nächsten Benutzer, der zu dieser Frage kommt
Ich würde sagen, es ist nah genug an dem, was du wolltest :)
quelle
Sie können die Ähnlichkeitsfunktion (pwrSIMILARITY) verwenden, um die Zeichenfolgen zu vergleichen und eine prozentuale Übereinstimmung der beiden zu erhalten. Sie können zwischen Groß- und Kleinschreibung unterscheiden oder nicht. Sie müssen entscheiden, wie viel Prozent einer Übereinstimmung für Ihre Anforderungen "nah genug" sind.
Es gibt eine Referenzseite unter http://officepowerups.com/help-support/excel-function-reference/excel-text-analyzer/pwrsimilarity/ .
Aber es funktioniert ziemlich gut, um Text in Spalte A mit Spalte B zu vergleichen.
quelle
Obwohl meine Lösung es nicht erlaubt, sehr unterschiedliche Zeichenfolgen zu identifizieren, ist sie für die teilweise Übereinstimmung (Teilzeichenfolgenübereinstimmung) nützlich, z. B. "Dies ist eine Zeichenfolge" und "eine Zeichenfolge" ergibt "Übereinstimmung":
Fügen Sie einfach "*" vor und nach der Zeichenfolge hinzu, um in die Tabelle zu suchen.
Übliche Formel:
wird
"&" ist die "Kurzversion" für verketten ()
quelle
Dieser Code scannt Spalte a und Spalte b, wenn er in beiden Spalten Ähnlichkeit findet, wird er gelb angezeigt. Sie können den Farbfilter verwenden, um den endgültigen Wert zu erhalten. Ich habe diesen Teil nicht in den Code eingefügt.
quelle