Ich verwende Pandas-Datenrahmen. Ich habe zum Beispiel einen ersten Datenrahmen D
. Ich extrahiere zwei Datenrahmen daraus:
A = D[D.label == k]
B = D[D.label != k]
dann ändere ich die beschriftung in A
undB
A.label = 1
B.label = -1
Ich möchte A und B kombinieren, damit ich sie als einen Datenrahmen haben kann, so etwas wie eine Gewerkschaftsoperation. Die Reihenfolge der Daten ist nicht wichtig. Wenn wir jedoch A und B von D abtasten, behalten sie ihre Indizes von D bei.
Sie können auch
pd.concat
Folgendes verwenden , was besonders hilfreich ist, wenn Sie mehr als zwei Datenrahmen verbinden:quelle
Ich dachte, dies hier hinzuzufügen, falls jemand es nützlich findet. @ostrokach hat bereits erwähnt, wie Sie die Datenrahmen zeilenübergreifend zusammenführen können
Zum Zusammenführen über Spalten hinweg können Sie die folgende Syntax verwenden:
quelle
Es gibt eine andere Lösung für den Fall, dass Sie mit Big Data arbeiten und mehrere Datensätze verketten müssen.
concat
kann leistungsintensiv werden. Wenn Sie also nicht jedes Mal eine neue df erstellen möchten, können Sie stattdessen ein Listenverständnis verwenden :(wie hier in den Dokumenten am Ende des Abschnitts erwähnt):
quelle
Wenn Sie die Werte des ersten Datenrahmens
df1
durch die Werte des zweiten Datenrahmens aktualisieren / ersetzen möchtendf2
. Sie können dies tun, indem Sie die folgenden Schritte ausführen:Schritt 1: Index des ersten Datenrahmens festlegen (df1)
Schritt 2: Index des zweiten Datenrahmens festlegen (df2)
und aktualisieren Sie schließlich den Datenrahmen mit dem folgenden Snippet -
quelle
1. Datenrahmen
Ergebnis:-
2. Datenrahmen
Ergebnis:-
Kombinieren
Prüfen
Ergebnis:-
quelle