我有一个用Python编写的文件,发送到Twitterstream并根据列表中的关键字获取消息。名单很长,输出不是我想要的。我想清理文件并将结果输出到文本文件。输出Tweepy TwitterStreamer到Python 2.7中的.csv
这里是我当前的代码,这将所有邮件写入一行:
import sys
....
if __name__ == '__main__':
with open("keywords.txt", "r") as f:
keywords = f.readlines()
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(track=keywords])
以上不拉任何东西,没什么意思是输出到当我输入一个文本文件,在命令如下提示python hashtagworking.py > output.txt
stream.filter
有大约300个项目,所以我想用一个txt文件来代替实际的文本。此外,每条消息的结果都显示在一条消息中,我将其重写为输出到消息中每个对象的csv文件。
我觉得这是我所期待的,但想确保:similar problem
我也想从其他嵌套对象之类的实体:{...}具体我想从实体对象获取哈希标签,但更具体地说是任何对象。我尝试过的东西,如data.text.hashtag
data.entities.hashtag
data.entities.media.hashtag
都无济于事。
谢谢@ketouem为csv文件,我期待转储在代码中被分隔的任何东西中,如果我有一天有5个元素,然后在第二天添加第6个元素,我希望第6个元素被添加。我将介绍你列出的文档,我还必须弄清楚如何从“实体”部分中分解出元素,我可能必须定义一个函数,或者学习如何分解json。 –
我将代码更新为我正在处理的问题 –
请注意,您可以使用eponym(&builtin)模块http://docs.python.org/2/library/json轻松操作原始json数据。 HTML – Ketouem