我想做一件简单的事情:从字符串(即HTML文件)中提取代码的某些特定部分。获取字符串中所有子字符串的出现
例如:
//Get a string from a website:
$homepage = file_get_contents('http://mywebsite.org');
//Then, search a particulare substring between two strings:
echo magic_substr($homepage, "<script language", "</script>");
//where magic_substr is this function (find in this awesome website):
function magic_substr($haystack, $start, $end) {
$index_start = strpos($haystack, $start);
$index_start = ($index_start === false) ? 0 : $index_start + strlen($start);
$index_end = strpos($haystack, $end, $index_start);
$length = ($index_end === false) ? strlen($end) : $index_end - $index_start;
return substr($haystack, $index_start, $length);
}
我想要得到的输出,在这种情况下,所有页面上的脚本。但在我的情况下,我只能得到第一个脚本。我认为这是对的,因为没有任何递归。但我不知道做这件事的最好方法是什么!有什么建议么?
小狗死可怕,只要你不使用[DOM解析器(http://php.net/manual/en/book.dom.php)找东西在html文档中。 – moonwave99
嗨,我试着用简单的Dom解析器,遇到了“max_nested_level”的麻烦..所以我以这种方式移动:) – alessandronos
max_nested_level的问题是什么?我相信PHP Simple DOM Dom Parser可以完成这些工作。 – raygo