2013-02-26 106 views
0

©想根据我输入的关键字从php论坛提取数据。 İs有东西准备好了,可以做到这一点? 只给例如 Kadinlarkulubu.com/forum.php 关键词IOS,Android的从论坛中提取数据

由于这个信息,我想要得到的日期,时间,消息,邮件的URL,关键词的消息,成员尼克是谁写的这条消息。

我需要在不同的论坛工作,所以我需要一个或多个工具,可以在像vBulletin这样的关键大平台上工作。

+0

我假设答案是否定的,但只是为了确保:您是否有权访问论坛的数据库? – Ynhockey 2013-02-26 08:41:29

回答

0

2种方式 最简单的办法是,如果论坛的所有者为您提供访问到论坛API唯一可能的(如果有的话),或者数据库

极端困难的方法是做一个采集,读取论坛一页接一页地分析你喜欢的信息,你可以使用的东西。

1

您需要制作属于自己的web crawler。如果您希望它在各种不同的平台上工作,则必须在该抓取工具上创建变体。

要开始,选择你最喜欢的论坛,并给它一个种子页面(从哪里开始爬行)。请仔细阅读,因为您可能需要登录才能看到帖子,如果是这样的话,可能不容易(例如,使抓取工具登录您,并打开验证码)。您也可以使用搜索功能(因为很多论坛的搜索网址类似于?q=your_tag&p=1,这可能会让事情变得更容易)。

只需检查您是否在同一个域中,而您不去进入一个无限循环,除此之外,你应该罚款。

希望这是一项长期的工程:)

另一种方法是使用API​​,如果该论坛提供了一个,但我怀疑你会太幸运了。