2013-08-25 35 views
0

我想拉一个网站的HTML,PHP - 的file_get_contents跳过风格和脚本

我使用file_get_contents($url)

当我运行file_get_contents那么它需要太多的时间拉主机站点的HTML, 我可以跳过样式,脚本和图像?

我觉得那样会花费更少的时间去拉那个网站的html。

+0

我觉得不包括一些HTML是不可能的。但是,如果您创建脚本来获取网站内容并将其存储在数据库中,该怎么办?当用户访问您的网站时,您可以查询数据库并将结果显示给用户。如果我们正在讨论的网站得到更新,则必须再次运行脚本并将新内容存储在数据库中。 –

+0

我拉其他用途的HTML,而不是用于存储在数据库 – user007

+0

我可以问你,你是拉什么目的,其他'网站的内容? –

回答

1

尝试:

$file = file_get_contents($url); 
$only_body = preg_replace("/.*<body[^>]*>|<\/body>.*/si", "", $file);