0
我试图将RDD中的列表中的所有元素转换为浮点数。这是我做过什么: RDD.map(lambda line:line.encode("ascii", "ignore").strip().split()).map(convertToFloat)
,并转换为浮动看起来像这样:将RDD中的元素列表转换为浮点数pyspark
def convertToFloat(lines):
returnedLine = []
for x in lines:
returnedLine.append(float(x))
return returnedLine
但这运转太慢。有没有办法用lambda函数替换map(convertToFloat)部分?
谢谢你!列表理解的工作更快一点 –
只是接受答案,如果你认为它是一个可以帮助你的答案。 http://stackoverflow.com/help/someone-answers –
非常感谢您的帮助Jean! –