Stellen Sie sich einen Pyspark-Datenrahmen vor, der aus 'Null'-Elementen und numerischen Elementen besteht. Im Allgemeinen haben die numerischen Elemente unterschiedliche Werte. Wie ist es möglich, alle numerischen Werte des Datenrahmens durch einen konstanten numerischen Wert zu ersetzen (zum Beispiel durch den Wert 1)? Danke im Voraus!
Beispiel für den pyspark-Datenrahmen:
Das Ergebnis sollte sein:
python
apache-spark
nur wir
quelle
quelle
Antworten:
Die Verwendung
lit
würde alle Werte der Spalte in den angegebenen Wert konvertieren.Um dies nur für Nicht-Null-Werte des Datenrahmens zu tun, müssten Sie Nicht-Null-Werte jeder Spalte filtern und Ihren Wert ersetzen.
when
kann Ihnen dabei helfen.Dies würde führen zu:
Wenn Sie diese Nullwerte auch durch einen anderen Wert ersetzen möchten, können Sie sie
otherwise
in Kombination mit verwendenwhen
. Angenommen, Sie möchten dort unterstellen0
:Dies würde führen zu:
quelle
Aufgrund Ihres Problems denke ich, dass es möglicherweise einfacher ist, beleuchtet zu verwenden . Versuche dies-
Ich hoffe es hilft!
quelle
Dies wäre einfacher, wenn Sie mehrere Spalten haben:
quelle