我有一个约6000万行的文件。我正在尝试编写一个需要不断查询文件以查找名称列表信息的脚本。文件中的每一行都包含一个名称,后跟相关的信息。我试图建立一个字典,但文件太大了。
我搜索了一堆论坛,并听到许多人建议SQlite for python-我只是想知道,在我开始学习SQlite之前,有谁知道这是否对这个大小的文件有帮助? 谢谢使用大数据
Q
使用大数据
0
A
回答
0
你可以使用Linux Power工具。 Awk可以很轻松地完成你的工作。
假设你的文件看起来像这样
name1 a b c
name2 e d r t
name3 x y
,你想找到名2信息。然后使用这个命令你可以找到
awk -F" " -v name=name2 '{if(name==$1){$1=""; print $0}}' filename
将只输出这样
e d r t
名2的信息,您可以通过多个名称和管理逻辑
+0
谢谢我试试这个 – user2906979
+0
你可以在一个文件中编写你的脚本并使用-f选项调用该文件。 awk -f script_filename input_filename –
相关问题
- 1. 使用大型数据库/数据集
- 2. 使用大量数据
- 3. H2O使用大数据集大小
- 4. 使用Android应用大型数据库
- 5. 使用c读取excel的大数据#
- 6. 使用sparkR合并大数据集
- 7. 使用jquery获取大量数据
- 8. 插入大量数据的使用Hibernate
- 9. 使用Node.js的大量数据加载
- 10. 使用JMSSerializerBundle导出大量数据
- 11. 使用来自mysql的大量数据
- 12. 对'大'数据使用'状态'和REDX
- 13. 使用Java从MySql处理大数据
- 14. 传输使用Java的巨大数据
- 15. 使用bash处理大量数据
- 16. 使用大熊猫多级数据帧
- 17. 使用地图来计算大数据
- 18. 使用AngularJS加载大型数据集
- 19. 数据库使用率最大%
- 20. 使用Java EE处理大量数据
- 21. 使用大数据进行SVM建模
- 22. 使用Azure处理大量数据
- 23. 使用Microsoft SQL Server的大数据
- 24. 使用android包装大型数据库
- 25. 使用sparklyr进行大数据滚动
- 26. 使用python清理大数据
- 27. 使用webGL加载大数据
- 28. 使用Hadoop匹配大型数据集?
- 29. 将数据写入使用大会
- 30. 使用Hive清理大数据
使用'numpy'从中获取信息文件。 –
numpy可以存储那么多信息吗? – user2906979
线条有多大?所需的内存量是行长度和记录数量的函数。 –