在pyarrow中,建议如何将pyarrow.Tensor
(例如从numpy.ndarray
创建)写入Parquet文件?甚至可以不经过pyarrow.Table
和pandas.DataFrame
?从地板拼接文件读取/写入拼音张量
1
A
回答
2
Parquet的数据模型是表格式的,因此tensor/ndarray必须转换为表格形式。我们没有任何内置的便利功能来帮助解决这个问题,但随时对问题跟踪器发出特定功能请求https://issues.apache.org/jira/projects/ARROW
1
Parquet格式针对嵌套数据表进行了优化,即它预期数据是表示为命名列。这与n维列的想法有点相反。对于张量,最好选择不同的格式。
相关问题
- 1. Python和Java中的拼音拼写
- 2. 如何拼接在tenforflow 2张量
- 3. torch7:如何拼合张量?
- 4. 如何将音频文件(wav格式)拼接成python中的1秒拼接?
- 5. 音频拼接剪辑
- 6. Haskell/Julius模板 - 不能拼接变量
- 7. 张量流中的拼合批量
- 8. 序言地板拼图
- 9. 编码拼音
- 10. 关于拼接文件
- 11. 如何写入拼接Spark数据框?
- 12. iOS音频:剪切和拼接音频?
- 13. 加快拼接2张图片?
- 14. 在opencv中拼接2张图片
- 15. 如何拼写excel中的文本,即使拼写错误
- 16. 拼音汉字python
- 17. 拼写检查
- 18. 拼接假&类变量
- 19. 自动拼接成矢量
- 20. 平铺拼接列向量
- 21. 德文的拼写检查
- 22. 拼写检查的文献?
- 23. 如何直接从网页读取/写入本地文件(html)
- 24. 拼写检查软件
- 25. Upsert进入拼接机
- 26. 从字节中提取和拼接位
- 27. C++截取函数拼接
- 28. 拼写检查属性文件
- 29. Vim使用错误的拼写文件?
- 30. C#拼写无效的文件句柄