0
我读文件(使用星火2.0)与模式推断后:力spark.read()的则InferSchema =真设置数值列不可为空
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('foo').getOrCreate()
df = spark.read.csv('myData.csv', inferSchema=True)
所有列,string
和数字,是空的。
但是,如果我使用显式模式读取文件,则只有string
列可以为空。
是否有办法强制read()
与inferSchema=True
设置可空性的方式与显式模式相同?