Ich arbeite an Excel-Tabellen, die Duplikate haben. Ich muss die Duplikate von Position 3 und 4 (Spalte 4 und 5) basierend auf dem frühesten Startdatum und dem spätesten Enddatum entfernen. Duplikate von Lok 1 und 2 (Spalte 2 und 3) DÜRFEN NICHT entfernt werden. Zum Beispiel Tylenol und Pepcid im Folgenden: Nur Duplikate mit einem Ja in Position 3 und 4 müssen mit dem frühesten Startdatum und dem spätesten Enddatum entfernt werden (siehe gewünschte Ausgabe). Ich habe viele komplizierte Tabellen, um dies zu tun. Hat jemand einen Vorschlag?
microsoft-excel
S.Yat
quelle
quelle
Antworten:
Ich würde Power Query dafür verwenden. Power Query ist ein kostenloses Add-In von Microsoft für Excel 2010 und 2013 und ist in Excel 2016 in der Multifunktionsleiste "Daten" unter "Get & Transform" integriert.
Power Query kann aus Excel-Tabellen oder benannten Bereichen lesen. Es verfügt über eine Funktion zum Gruppieren nach, mit der Min- und Max-Werte für Ihre Start- und Enddatumanforderungen berechnet werden können.
Für Ihre bedingte Gruppierungsanforderung würde ich dem Power Query-Entwurf eine Spalte hinzufügen, um sie beispielsweise zu gruppieren
if [Loc 3] = "Y" or [Loc 4] = "Y" then "Y" else "N"
Dann würde ich nach dieser Spalte gruppieren und das Maximum von Loc 3 und Loc 4 berechnen.
quelle