Q

从地板拼接文件读取/写入拼音张量

2017-10-17 244 views 1 likes

1

在pyarrow中，建议如何将pyarrow.Tensor（例如从numpy.ndarray创建）写入Parquet文件？甚至可以不经过pyarrow.Table和pandas.DataFrame？从地板拼接文件读取/写入拼音张量

2017-10-17 Martin Studer

A

回答

2

Parquet的数据模型是表格式的，因此tensor/ndarray必须转换为表格形式。我们没有任何内置的便利功能来帮助解决这个问题，但随时对问题跟踪器发出特定功能请求https://issues.apache.org/jira/projects/ARROW

2017-10-17 21:12:55

1

Parquet格式针对嵌套数据表进行了优化，即它预期数据是表示为命名列。这与n维列的想法有点相反。对于张量，最好选择不同的格式。

2017-10-18 05:47:02 xhochy

相关问题