Wie greife ich mit dem Schlüssel auf den entsprechenden groupby-Datenrahmen in einem groupby-Objekt zu?
Mit folgender Gruppe:
rand = np.random.RandomState(1)
df = pd.DataFrame({'A': ['foo', 'bar'] * 3,
'B': rand.randn(6),
'C': rand.randint(0, 20, 6)})
gb = df.groupby(['A'])
Ich kann es durchlaufen, um die Schlüssel und Gruppen zu erhalten:
In [11]: for k, gp in gb:
print 'key=' + str(k)
print gp
key=bar
A B C
1 bar -0.611756 18
3 bar -1.072969 10
5 bar -2.301539 18
key=foo
A B C
0 foo 1.624345 5
2 foo -0.528172 11
4 foo 0.865408 14
Ich möchte über ihren Schlüssel auf eine Gruppe zugreifen können:
In [12]: gb['foo']
Out[12]:
A B C
0 foo 1.624345 5
2 foo -0.528172 11
4 foo 0.865408 14
Aber wenn ich das mit versuche, gb[('foo',)]
bekomme ich dieses seltsame pandas.core.groupby.DataFrameGroupBy
Objekt, das keine Methoden zu haben scheint, die dem gewünschten DataFrame entsprechen.
Das Beste, was ich mir vorstellen kann, ist:
In [13]: def gb_df_key(gb, key, orig_df):
ix = gb.indices[key]
return orig_df.ix[ix]
gb_df_key(gb, 'foo', df)
Out[13]:
A B C
0 foo 1.624345 5
2 foo -0.528172 11
4 foo 0.865408 14
Aber das ist irgendwie böse, wenn man bedenkt, wie nett Pandas normalerweise in diesen Dingen sind.
Was ist die eingebaute Methode, um dies zu tun?
groups = dict(list(gb))
nur eine Spalte gespeichert wirdC
? Angenommen, ich interessiere mich nicht für die anderen Spalten und möchte sie daher nicht speichern.dict(list( df.groupby(['A'])['C'] ))
dict(iter(g))
. (obwohlget_group
es der beste Weg ist / da es nicht darum geht, ein Wörterbuch zu erstellen / hält dich in Pandas !: D)gb_dict = {str(indx): str(val) for indx in gb.indx for val in gb.some_key}
und dann den Wert übergb_dict[some_key]
get_group()
, dieses Rezept wird seit Jahren nicht mehr benötigt.Eher, als
Ich benutze lieber
gb.groups
Denn auf diese Weise können Sie auch mehrere Spalten auswählen. beispielsweise:
quelle
gb[["A", "B"]].get_group("foo")
.Wenn Sie nach selektiven Groupby-Objekten suchen, gehen Sie wie folgt vor: gb_groups.keys () und geben Sie den gewünschten Schlüssel in die folgende Schlüsselliste ein.
quelle
Ich suchte nach einer Möglichkeit, einige Mitglieder des GroupBy-Objekts zu befragen - musste die gestellte Frage beantworten, um dies zu erreichen.
Groupby-Objekt erstellen
Wählen Sie N Datenrahmen und greifen Sie auf deren Angaben zu
Schnapp dir die Gruppen
Optional - verwandeln Sie alles wieder in ein einziges Datenrahmenobjekt
quelle
sampled_df_i = random.sample(grouped.indicies, N)
AttributeError: 'DataFrameGroupBy' object has no attribute 'indicies'