2013-03-31 66 views
-1

我有一个很大的HTML内容条目。我只需要将纯文本拆分为数组中的单独条目,以便我可以通过翻译工具运行它,然后将其替换为原始的html。PHP strip_tags - 将标签拆分为数组

我已经设法清除它,然后将行分割成一个数组,但文本...to do this <a href="#" title="blah">click here</a>返回为...to do this click here

str_replace做一个str_replace由于a标签,该文本将不再匹配。

所以,我需要一种方法来将通常会使用strip_tags剥离的标签转换为插入的值,我可以使用该值插入字符串。

有什么建议吗?

+2

只需使用DOM访问每个部分。 –

+0

不要重新发明轮子:) http://simplehtmldom.sourceforge.net/ –

+0

而不是SimpleHtmlDom使用这些http://us3.php.net/manual/en/book.dom.php其中的一部分PHP并且会一直工作,不会将您的代码绑定到您不需要实现此目的的第三方库。 –

回答

0

好吧,我已经想通了,在这种情况下DOM比我需要的更复杂。

更简单的解决方案是使用正则表达式匹配来查找所有标记,然后将html分解。

preg_split('/<.+?>/', $html); 

这只留下文本。由于我不需要任何标签信息,因此处理速度也应该更快。