Ich verwende pyspark (Python 2.7.9 / Spark 1.3.1) und habe einen Datenrahmen GroupObject, den ich in absteigender Reihenfolge filtern und sortieren muss. Der Versuch, dies über diesen Code zu erreichen.
group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False)
Es wird jedoch der folgende Fehler ausgegeben.
sort() got an unexpected keyword argument 'ascending'
python
apache-spark
dataframe
pyspark
apache-spark-sql
rclakmal
quelle
quelle
In pyspark 2.4.4
1) group_by_dataframe.count().filter("`count` >= 10").orderBy('count', ascending=False) 2) from pyspark.sql.functions import desc group_by_dataframe.count().filter("`count` >= 10").orderBy('count').sort(desc('count'))
Keine Notwendigkeit zum Importieren in 1) und 1) ist kurz und leicht zu lesen,
daher bevorzuge ich 1) gegenüber 2)
quelle
Sie können groupBy und orderBy auch wie folgt verwenden
dataFrameWay = df.groupBy("firstName").count().withColumnRenamed("count","distinct_name").sort(desc("count"))
quelle