Gibt es eine Möglichkeit, Duplikate in einem großen Bereich in Excel zu kombinieren?

0

Ich habe eine große Tabelle mit Verkaufsdaten (1,7 Millionen Zeilen) auf einem Blatt in Excel, von denen viele Einträge identisch sind, abgesehen von einer eindeutigen ID und einem Zeitstempel. Ich möchte diese Daten konsolidieren, indem ich die nach meinen Standards duplizierten Zeilen kombiniere (d. H. Nur eindeutige Parameter, die mir egal sind).

Dies allein könnte fast erreicht werden, indem Sie die Funktion "Duplikate entfernen" verwenden. Ich sage jedoch "Kombinieren", da ich auch möchte, dass das Ergebnis eine der Spalten summiert, die angibt, wie viele Elemente Teil dieser bestimmten Reihenfolge waren.

Ich möchte von so etwas ausgehen:

   A    |    B    |    C    |    D    |    E    |    F    |    “OldSheet”
  OID   |  Client | Program |  Count  |  Status |  Time   |
 436266 | Initech |   SEO   |    1    | Invoiced|  00:52  |
 436267 | Initech |   SEO   |    2    | Invoiced|  01:12  |
 436269 | Initech |   SEM   |    1    | Invoiced|  04:52  |
 436268 |Initrode |   SEO   |    1    | Invoiced|  02:22  |
 436269 | Initech |   SEM   |    3    | Invoiced|  04:52  |

. . . zu so etwas:

  OID   |  Client | Program |  Count  |  Status |  Time   |    “NewSheet”
 ...... | Initech |   SEO   |    3    | Invoiced|  .....  |
 ...... | Initech |   SEM   |    4    | Invoiced|  .....  |
 ...... |Initrode |   SEO   |    1    | Invoiced|  .....  |

Diese Tabelle wird letztendlich von mehreren Pivot-Tabellen referenziert, sodass dasselbe Format beibehalten werden muss.

Tyler James Young
quelle
1
Haben Sie versucht, einen Pivot-Tisch zu verwenden? Keine Formeln erforderlich.
Andi Mohr
... oder eine Datenbank? "GRUPPIERE NACH"
TheUser1024
Weder eine Pivot-Tabelle noch eine Datenbank funktionierten für mich, da ich alles in diesem genauen Format haben musste, damit andere Pivot-Tabellen weiterhin darauf verweisen konnten.
Tyler James Young
1
Ah, habe ich gerade gesehen, nachdem ich meine Antwort gepostet habe. Können Sie Ihre Frage bearbeiten, um diese Anforderung hinzuzufügen? Es ist ein entscheidendes Detail.
Andi Mohr

Antworten:

1

So könnte eine Lösung mit einer Pivot-Tabelle aussehen.

Um das tabellarische Layout zu erhalten, wechseln Sie in das Menü Pivot Table Design und ändern Sie das Berichtslayout in Im Tabellenformat anzeigen . Zwischensummen für jede Spalte deaktivieren.

Denken Sie daran, eine SUMME in Ihrem "Count" -Wertfeld zu verwenden, da Sie Zahlen größer als 1 enthalten.

enter image description here

Andi Mohr
quelle
Das könnte tatsächlich einfacher sein, Andi. Ich müsste den Pivot einfach wieder als Werte einfügen, sobald ich ihn habe. Der Hauptgrund, warum ich Pivots gemieden habe, ist, dass ich wirklich schlecht darin bin. Ich wusste nichts über das Tabellenformat, das ist also großartig.
Tyler James Young
0

Ich habe das herausgefunden, als ich diese Frage schrieb. Meine Lösung bestand darin, die alte Tabelle auf eine neue Registerkarte zu kopieren, Duplikate zu entfernen, die nur auf den von mir betroffenen Spalten basieren, und dann eine SUMIFS () - Formel in die neue Spalte "count" einzufügen, die jede Zelle in der alten Registerkarte mit den Zellen in vergleicht Die Spalten, die mir wichtig sind, in der neuen Registerkarte und die Zahlen in der alten Spalte "count" für jede Zeile, die allen Kriterien entspricht. Hier ist meine Formel (angepasst für das obige Beispiel):

=SUMIFS(OldSheet!D:D,OldSheet!B:B,NewSheet!B2,OldSheet!C:C,NewSheet!C2,OldSheet!E:E,NewSheet!E2)
Tyler James Young
quelle