2010-07-08 64 views
0

我正在使用strpos查找字符串到网页主体。 50%失败,尽管搜索字符串存在。 我试图将strtolower搜索字符串和搜索内容,相同的结果。 Probabily不同字符集打交道时,问题就出现了......字符串查找到未知的字符集html内容

假设: - 搜索字符串的字符集是未知 - 搜索内容的字符集是未知 - 字符集可以是任何ISOxx,UTF-8,按住Shift-JIS

是否有防弹功能来查找子字符串?

回答

0

烨的HTML转换成UTF8/latin1的第一,抓住从Content-Type头或meta标签的内容编码,用iconv转换成UTF8/LATIN1,那么不用担心它

+0

- 某些表现不佳的页面不使用内容类型 - 它也可以用于SJIS页面吗? – Riccardo 2010-07-08 15:21:54

1

你可以试试使用mb_detect_encoding先检测编码,然后转换为您想要使用的编码(使用iconv或mb_convert_encoding),然后在该编码中搜索该模式。

+0

我读过的地方mb_detect_encoding容易失败.​​.. – Riccardo 2010-07-08 16:13:14