Pandas erhalten Spaltenmittelwert / Mittelwert mit rundem Wert

151

Ich kann den Durchschnitt oder Mittelwert einer Spalte in Pandas nicht ermitteln. A haben einen Datenrahmen. Keines der Dinge, die ich unten ausprobiert habe, gibt mir den Durchschnitt der Spalteweight

>>> allDF 
         ID           birthyear  weight
0        619040       1962       0.1231231
1        600161       1963       0.981742
2      25602033       1963       1.3123124     
3        624870       1987       0.94212

Im Folgenden werden mehrere Werte zurückgegeben, nicht einer:

allDF[['weight']].mean(axis=1)

So auch:

allDF.groupby('weight').mean()
Peperoni Pizza
quelle
df.groupby('weight')war nicht das, was Sie wollten, weil es den df in separate Spalten mit jeweils einem bestimmten Gewichtswert aufteilte. Statt nurdf['weight'].mean()
smci
allDF. weight.mean ()
DataFramed

Antworten:

263

Wenn Sie nur den Mittelwert der weightSpalte möchten , wählen Sie die Spalte (die eine Serie ist) aus und rufen Sie auf .mean():

In [479]: df
Out[479]: 
         ID  birthyear    weight
0    619040       1962  0.123123
1    600161       1963  0.981742
2  25602033       1963  1.312312
3    624870       1987  0.942120

In [480]: df["weight"].mean()
Out[480]: 0.83982437500000007
DSM
quelle
1
und was wäre, wenn ich einen Mittelwert aus jeder einzelnen Spalte erhalten wollte?
Chris
3
@ Chris df.describe ()
Abhishek Poojary
2
@Chris df.mean () gibt Ihnen das Gewicht jeder Spalte an und gibt es in einer Reihe zurück.
Emschorsch
24

Versuchen Sie df.mean(axis=0), das axis=0Argument berechnet den spaltenweisen Mittelwert des Datenrahmens, sodass das Ergebnis der axis=1zeilenweise Mittelwert ist, sodass Sie mehrere Werte erhalten.

Chandu
quelle
13

Versuchen Sie, print (df.describe())einen Schuss zu geben . Ich hoffe, es ist sehr hilfreich, eine allgemeine Beschreibung Ihres Datenrahmens zu erhalten.

Nainometer
quelle
1
display(df.describe())ist besser (in Jupyter Notebooks), da displayipython formatiertes HTML anstelle von ASCII bereitstellt, was visuell nützlicher / ansprechender ist.
Zhanwen Chen
6

Sie können verwenden

df.describe() 

Sie erhalten grundlegende Statistiken des Datenrahmens und den Mittelwert einer bestimmten Spalte, die Sie verwenden können

df["columnname"].mean()
Arun Singh
quelle
1
Dies ist ein Duplikat der oben genannten Antworten.
Mehdi Boukhechba
6

Sie können auch mit der Punktnotation (auch Attributzugriff genannt) auf eine Spalte zugreifen und dann deren Mittelwert berechnen:

df.your_column_name.mean()
Nikos Tavoularis
quelle
4

Mittelwert für jede Spalte in df:

    A   B   C
0   5   3   8
1   5   3   9
2   8   4   9

df.mean()

A    6.000000
B    3.333333
C    8.666667
dtype: float64

und wenn Sie den Durchschnitt aller Spalten wollen:

df.stack().mean()
6.0
Harvey
quelle
1

Zusätzlich, wenn Sie den roundWert nach dem Finden der erhalten möchten mean.

#Create a DataFrame
df1 = {
    'Subject':['semester1','semester2','semester3','semester4','semester1',
               'semester2','semester3'],
   'Score':[62.73,47.76,55.61,74.67,31.55,77.31,85.47]}
df1 = pd.DataFrame(df1,columns=['Subject','Score'])

rounded_mean = round(df1['Score'].mean()) # specified nothing as decimal place
print(rounded_mean) # 62

rounded_mean_decimal_0 = round(df1['Score'].mean(), 0) # specified decimal place as 0
print(rounded_mean_decimal_0) # 62.0

rounded_mean_decimal_1 = round(df1['Score'].mean(), 1) # specified decimal place as 1
print(rounded_mean_decimal_1) # 62.2
Md. Tanvir Raihan
quelle
1

Sie können eine der beiden folgenden Anweisungen verwenden:

numpy.mean(df['col_name'])
# or
df['col_name'].mean()
Davidbilla
quelle
Bitte bereichern Sie Ihre Antwort mit richtigen Kommentaren. Andernfalls wird es wahrscheinlich zum Löschen markiert
Don
0
You can easily followthe following code
    `import pandas as pd 
    import numpy as np 

    classxii = {'Name':['Karan','Ishan','Aditya','Anant','Ronit'],
        'Subject':['Accounts','Economics','Accounts','Economics','Accounts'],
        'Score':[87,64,58,74,87],
        'Grade':['A1','B2','C1','B1','A2']}
    df = pd.DataFrame(classxii,index = ['a','b','c','d','e'],columns=['Name','Subject','Score','Grade'])
    print(df)
    #use the below for mean if you already have a dataframe
print('mean of score is:')
print(df[['Score']].mean())
JÄGER
quelle
0

Sie können einfach Folgendes wählen: df.describe (), das Ihnen alle relevanten Details liefert, die Sie benötigen. Um jedoch den minimalen, maximalen oder durchschnittlichen Wert einer bestimmten Spalte zu ermitteln (in Ihrem Fall "Gewichte"), verwenden Sie:

    df['weights'].mean(): For average value
    df['weights'].max(): For maximum value
    df['weights'].min(): For minimum value
SHAGUN SHARMA
quelle