2017-09-07 79 views
0

有没有人解决了错误:消息:compressions['SNAPPY'] = snappy.compress AttributeError: module 'snappy' has no attribute 'compress' 当阅读python实木复合地板?顺便说一句,有没有办法阅读整个目录?python 3 mac:snappy.compress属性错误:模块'snappy'没有属性'compress'

我在Mac上使用python 3通过conda安装按https://pypi.python.org/pypi/parquet

代码snappythrift如下:

import parquet 
import json 
import fastparquet 

with open(data_in_path + "file.parquet/part-01snappy.parquet", 'rb') as fo: 
for row in parquet.DictReader(fo, columns=['id', 'title']): 
    print(json.dumps(row)) 

df2 = fastparquet.ParquetFile(path).to_pandas() 

回答

0

无法找到snappy解决方案,所以我用读取spark中的数据,并将其与每个没有问题蟒蛇后gzip写回发现:

df.coalesce(1).write.option("overwrite","true").option("compression","gzip").parquet(dfWithGzip.parquet") 
0

我有同样的问题。

原因是我安装了错误的python包。您应该安装的python-snappy代替snappy

在我的情况(OS X),这是一个简单的两个步骤:

brew install snappy 
pip install python-snappy 
相关问题