包含点的pyspark数据帧(例如“id.orig_h”)将不允许groupby
uppon,除非首先被withColumnRenamed
重命名。有没有解决方法? "`a.b`"
似乎没有解决它。pyspark数据框的访问列带点“。”
1
A
回答
4
在我pyspark壳,下面的代码片段正在努力:
from pyspark.sql.functions import *
myCol = col("`id.orig_h`")
result = df.groupBy(myCol).agg(...)
和
myCol = df["`id.orig_h`"]
result = df.groupBy(myCol).agg(...)
我希望它能帮助。
+0
谢谢@Daniel de Paula的回答。你能确认使用''groupby(“'id.orig_h'”)''不起作用吗? –
+0
@HananShteingart,对于我来说,下面的代码有效:'df.groupBy(“\'id.orig_h \'”)。agg(...)' –
+0
对我来说它并不是。你可以请添加更多的列从ID开始。 ?我使用pyspark 1.6 –
相关问题
- 1. PySpark访问计数列
- 2. PySpark数据框:点到点的逗号
- 3. pyspark数据框列名
- 4. 过滤Pyspark数据框列
- 5. Pyspark:从pyspark数据框中
- 6. 访问数据框中的列名称
- 7. 访问列表框中的数据
- 8. Pyspark数据框中SQL
- 9. 汇总数据框中pyspark
- 10. Pyspark:使用数据框
- 11. 从数据框列表中访问熊猫数据框对象
- 12. 访问pyspark中的数据帧的计数值
- 13. 如何从pyspark数据框检索列并将其作为新列插入到现有pyspark数据框中?
- 14. 数据不被填充数据框 - PySpark
- 15. 如何在pyspark中创建列表的数据框的元组的数据框?
- 16. PySpark:从列值中命名一个新的数据框列
- 17. 替换pyspark数据框中的值
- 18. PySpark将新列添加到数据框与新列表
- 19. Pyspark - 在火花数据框列使用reducebykey即列出
- 20. Pyspark - 排序数据框中列包含列表
- 21. 字符串类型的pyspark数据框列的条形码
- 22. PySpark数据框:根据条件同时更改两列
- 23. 如何将带匹配标点的列加入数据框?
- 24. 在MySql的列名中使用多个点访问列数据
- 25. 如何访问列表中的所有数据点中列出
- 26. 铸造带有文本列的数据框的问题
- 27. 带有2行数据的列表框
- 28. 如何更改pyspark中的数据框列名?
- 29. Pyspark替换Spark数据框列中的字符串
- 30. PySpark:为数据框中的每一行获取顶部k列
你可以分享你正在使用的代码组吗? –