0
Q
阅读大数据子集
A
回答
0
可以使用read.csv
不过滤行。您可以尝试sqldf::read.csv.sql
,如答案to this question中所述。
但我想大多数人会先使用其他工具处理文件。例如,csvkit允许按行进行过滤。
相关问题
- 1. 阅读大型数据集大熊猫
- 2. 阅读数据集
- 3. 阅读数据集
- 4. 阅读1GB大小excel与1.5记录每张到数据集
- 5. 阅读CSV与大熊猫有这种数据集
- 6. 性能阅读大型数据集从多个并行线程
- 7. 阅读R中的复杂数据集
- 8. 阅读HDF5数据集与熊猫
- 9. 阅读3维数据集成R
- 10. 阅读MNIST数据集使用F#
- 11. 如何读取R中大数据集的子集?
- 12. 阅读/写入大量数据
- 13. 子集大数据帧
- 14. Android - Firebase |阅读所有的子数据
- 15. CSVGREP子集大型数据集
- 16. 阅读grib2数据
- 17. 阅读excel数据
- 18. 阅读Json数据
- 19. 阅读firebase数据
- 20. 阅读从asp.net web api返回的任意数据集数据
- 21. NSInputStream阅读:最大长度:无法读取数据,返回-1
- 22. 如何高效地搜索子数据集的大数据集?
- 23. 用R表示大数据集中数据帧的子集
- 24. 阅读大文件
- 25. 订阅大集合
- 26. BufferedReader阅读Json数据
- 27. 阅读TIFF栅格数据
- 28. 阅读文本数据
- 29. 阅读分块数据
- 30. 阅读与像数据库
如果您知道它们在哪里(并且它们在一起),则可以使用'read.csv'的'skip'和'nrows'参数。如果你不知道,那么'grep'可能是有序的。 – alistaire
如果你真的想把它全部保存在R中,可以很容易地以批处理的方式读取文件(有多少实际取决于可用的内存),使用'lapply',按照你需要的进行子集分类,事实之后的很多。尽管如此,您可能希望使用'data.table :: fread'或'readr :: read_csv'来实现速度,但它仍然不是最快的方法,因为它会执行大量的过度处理。尽管如此,稍微优化它并不会那么困难。 – alistaire