2014-03-03 77 views
0

我正在寻找一个应用程序,它可以跟踪Twitter中的hashtag,获取id和文本,并将其存储在MySQL数据库中。因此,应用程序应该能够 -在twitter上跟踪标签

  1. 继续检查以查看是否有人在特定哈希标签上发送了推文(例如 - #example)。
  2. 存储推文的详细信息。

我的代码可以请求twitter搜索哈希标签,并返回包含给定哈希标签的20条推文列表。

所以现在我的问题是:

  1. 如何确保同样的鸣叫不会被再次拉升? (我可以随时存储推特ID,并检查添加新推文时是否已存在,但不知道这是否是正确的方法)
  2. 我想在几个小时内完成此操作,所以我是否需要包含任何类型的刷新代码或可以不断运行搜索的内容? (具体而言,我想搜索并且加上新的鸣叫,不存在的。因此,任何人谁鸣叫后,我开始跟踪主题标签,我想那些鸣叫得到保存)

更多信息/代码,需要,请问,我可以在这里发布!忍受着我,我是这个初学者。

+0

使用Twitter API。 – poke

回答

-1

所以,我认为你应该使用正则表达式 - >Here

Twitter的鸣叫的结构如下:

`<div class="tweet original-tweet js-stream-tweet js-actionable-tweet js-profile-popup-actionable js-original-tweet" data-you-block="false" data-you-follow="false" data-expanded-footer="<div class="js-tweet-details-fixer tweet-details-fixer"> … tabindex="-1">Details</a> </span> </div> </div>" data-user-id="25324805" data-name="~*Beebe♡Bluff*~" data-screen-name="UrBabygurrl" data-item-id="440556385688748032" data-tweet-id="440556385688748032" data-feedback-key="stream_status_440556385688748032"` 

也许你应该过滤通过的数据项-ID鸣叫? 如果你想检查鸣叫每小时,一天,一周,一个月等,你应该使用cron :)

+0

我主要试图了解如何进行侦听过程:)我需要把某些类型的循环语句中的获取tweets函数?或者它是否会自动获取所有推文?它如何知道给定的推文是新的,并且之前未被其捕获? –

+1

-1 [不要使用正则表达式解析HTML](http://stackoverflow.com/a/1732454/216074)。另外,Twitter提供了一个API,所以有*真的*不需要查询Twitter网站。 – poke

+0

感谢您的建议:)我忘了Twitter API,我很愚蠢:) – ajtamwojtek