2010-12-13 49 views
0

美好的一天,从其他网站获取最新信息并在PHP中发布在您的网站上

我已经建立了一个现有的网站。我想知道,当另一个网站更新时,我的网站如何自动更新?这基本上意味着我的现有网站将在更新时从其他网站获取成本,描述等图片。

我在琢磨Web服务,但其他网站没有它。

请指教!

谢谢!

+0

我猜你不能在*其他*网站上改变任何内容,只是在你的网站上? – deceze 2010-12-13 07:04:18

+0

其他网站是否有任何类型的API? – 2010-12-13 07:04:39

+0

@deceze - 是不能改变任何东西 – aHaH 2010-12-13 07:08:28

回答

2

如果其他站点没有API,唯一的选择是页面抓取,即下载HTML并解析它以提取所需的信息。

如果他们有一个不经常更改的页面结构,这通常是可靠的。

您可能想要使用PHP的DomDocument来提取信息。

一般来说,人们并不喜欢它,因为设计不当的工具可能会对系统资源征税,因为生成整个HTML页面比生成API响应更耗费资源。

页面抓取相当普遍,尽管有些人不鼓励它。它可能会被一个网站的TOU所禁止,可能会有法律影响。或者,您的目标网站可能没有问题。当然,在页面抓取时建立了大型企业(参见'Google')。

+0

马克,非常感谢!会试试看! – aHaH 2010-12-13 07:16:44

+0

Hrm ...我猜Google *会被认为是页面刮板。以前从来没有这样想过。我想我会更关心盗用我的内容的人,而不是对我的服务器征税。 – mpen 2010-12-13 07:38:46