“PYSPARK MAPREDUCE DataFrame” Code-Antworten

PYSPARK MAPREDUCE DataFrame

df.rdd \
  .filter(lambda x: x[1] == "france") \ # only french stations
  .map(lambda x: (x[0], x[2])) \ # select station & temp
  .mapValues(lambda x: (x, 1)) \ # generate count
  .reduceByKey(lambda x, y: (x[0]+y[0], x[1]+y[1])) \ # calculate sum & count
  .mapValues(lambda x: x[0]/x[1]) \ # calculate average
  .sortBy(lambda x: x[1], ascending = False) \ # sort
  .take(100)

Worried Willet

ActionScript

“PYSPARK MAPREDUCE DataFrame” Code-Antworten

PYSPARK MAPREDUCE DataFrame

Ähnliche Antworten wie “PYSPARK MAPREDUCE DataFrame”

Fragen ähnlich wie “PYSPARK MAPREDUCE DataFrame”

Weitere verwandte Antworten zu “PYSPARK MAPREDUCE DataFrame” auf Python

Durchsuchen Sie beliebte Code-Antworten nach Sprache

Shell/Bash

C#

C++

C

CSS

HTML

Java

JavaScript

Objective-C

PHP

Python

Sql

Swift

Ruby

TypeScript

Go

Kotlin

Assembly

R

VBA

Scala

Rust

Dart

Elixir

Clojure

Haskell

Matlab

Erlang

Cobol

Fortran

Scheme

Perl

Groovy

Lua

Julia

Delphi

Abap

Lisp

Prolog

Pascal

ActionScript

Basic

Solidity

PowerShell

GDScript

Excel

Durchsuchen Sie andere Codesprachen