0
A
回答
0
randint函数是你所需要的:它在两个数字之间生成一个随机整数。将其应用于“年龄”列的fillna spark函数。
from random import randint
df.fillna(randint(14, 46), 'age').show()
1
马拉的答案是正确的,如果你想用相同的随机数来代替空值,但如果你想每个年龄段的随机值,你应该做的事情结合并F.rand()如下图所示:
import pyspark.sql.functions as F
from pyspark.sql.functions import lit
from pyspark.sql.types import IntegerType
from random import randint
df = sqlContext.createDataFrame(
[(1, "a", 23.0), (3, "B", -23.0)], ("x1", "x2", "x3"))
df = (df
.withColumn("x4", F.lit(None).cast(IntegerType()))
.withColumn("x5", F.lit(None).cast(IntegerType()))
)
df.na.fill({'x4':randint(0,100)}).show()
df.withColumn('x5', F.coalesce(F.col('x5'), (F.round(F.rand()*100)))).show()
+---+---+-----+---+----+
| x1| x2| x3| x4| x5|
+---+---+-----+---+----+
| 1| a| 23.0| 9|null|
| 3| B|-23.0| 9|null|
+---+---+-----+---+----+
+---+---+-----+----+----+
| x1| x2| x3| x4| x5|
+---+---+-----+----+----+
| 1| a| 23.0|null|44.0|
| 3| B|-23.0|null| 2.0|
+---+---+-----+----+----+
相关问题
- 1. 用随机数填充int []
- 2. 用随机数填充我的数组?
- 3. Javascript数组随机填充
- 4. CSS随机填充
- 5. 用随机数填充数组
- 6. 用随机数字填充数组android_java
- 7. 用随机整数值填充数组
- 8. 如何用中位数填充NA?
- 9. 填充一个ListView用随机数据
- 10. 用随机数据填充内存
- 11. 用随机数据填充表格
- 12. SQL填充表用随机数据
- 13. 用随机排列填充数组
- 14. 填充在Pyspark数据帧
- 15. 用NA值填充列
- 16. 填充的5个随机整数
- 17. 随机填充2d阵列
- 18. 我的数组中的随机数由上一个随机数填充
- 19. 随机数生成在PySpark
- 20. pyspark:随机化数据帧中的行
- 21. 程序中的内存错误,用随机数填充数组
- 22. 用C++中的随机数填充二维数组
- 23. MySql用于随机填充行的过程只填充一行
- 24. 填充在IMG SRC随机数
- 25. 随机嵌套和填充数组
- 26. 用随机值填充通用向量
- 27. 用随机数据填充的表中的外键值MYSQL
- 28. 用Python中的随机数据填充mysql表
- 29. 使用数组中的随机项填充列表框
- 30. 用随机值填充c#对象
虽然此代码段可以解决的问题,[包括一个解释](// meta.stackexchange.com/questions/114762/explaining-entirely-code-based-answers)确实有助于提高您的帖子的质量。请记住,您将来会为读者回答问题,而这些人可能不知道您的代码建议的原因。也请尽量不要用解释性注释来挤占代码,这会降低代码和解释的可读性! – kayess