阅读文本文件当我使用R,我能读懂它们包含在一个文件夹一次性许多文本文档。 但是,我刚开始学习Python。当我使用命令:file = open('c:/txt/Romney', 'r')
,试图打开包含在罗姆尼文件夹中的所有文本文件,我发现我要读内文用一个文件中的一个,我不能阅读所有一次性就像我在河做什么建议吗?文本挖掘:在Python
回答
在像Python语言,你需要使用一个for
循环在时间阅读每个文件的内容之一。
(相关:How to list all files of a directory in Python)
from os import listdir
from os.path import isfile, join
path = "C:/txt/Romney"
files = [ f for f in listdir(path) if isfile(join(path,f)) ]
for file in files:
with open file as f:
text = f.read()
do_something_with(text)
除了戴夫Yarwood的回答,如果你真正想要做的是串联的文件,你可以用做:
from os import listdir
from os.path import isfile, join
from itertools import chain
path = "C:/txt/Romney"
files = [open(f) for f in listdir(path) if isfile(join(path,f))]
for line in chain(*files):
do_something_with(line)
(只为了好玩,因为我从来没有用过itertools.chain
串起来文件之前)
你不应该再对文件的文件做':file.close()'? –
而不会是'[f.open()对于F中...'? –
@DaveYarwood当对象被垃圾收集时,文件会自动关闭。而'listdir'只是返回一个字符串列表,而不是文件句柄。字符串没有“开放”方法。 –
- 1. 使用Python进行文本挖掘
- 2. Python,文本挖掘,docx到表(CSV)
- 3. 中文文本挖掘
- 4. python数据挖掘
- 5. [R文本挖掘问题
- 6. stemDocument [R文本挖掘
- 7. 文本挖掘中的R
- 8. 挖掘维基百科映射文本挖掘关系
- 9. 的Oracle SQL导航数据挖掘文本挖掘
- 10. 文本挖掘单个文本文档
- 11. Kmeans聚类和文本挖掘在R
- 12. R采用量化的文本挖掘
- 13. 如何文本挖掘特定数据
- 14. BeautifulSoup文本挖掘 - 变量字符串
- 15. 如何数据挖掘文本?
- 16. 文本挖掘和机器学习
- 17. 带r库的文本挖掘stringdist
- 18. 文本挖掘与R:使用子
- 19. UIAlertView如果CCMenuItemFont(文本)挖掘
- 20. 电子邮件的文本挖掘
- 21. 创建词汇辞典文本挖掘
- 22. 存储文本数据挖掘的
- 23. 文本挖掘/相似论坛
- 24. 取代R中data.frames(文本挖掘)
- 25. 使用PHP进行文本挖掘
- 26. 文本挖掘与斯卡拉
- 27. 文本挖掘中的功能数
- 28. 文本挖掘库或语言库?
- 29. 文本挖掘中的矩阵控制
- 30. 从文本中挖掘位置
你所说的“一次性”是什么意思?你想连接它们吗?或者一个一个迭代它们? –
我很好奇R是如何做到的。这种行为听起来像R试图猜测你可能想要做什么 – MxyL
发布你试图在Python中模拟/复制的R代码会有帮助。 – hrbrmstr