我正在解析HTML中的元标记。一切工作正常,但在某些情况下,我无法相应地解析meta标签。无法从html解析元标记
这里是标签格式:<meta property="fb:pages" content="6456456"/>
正则表达式:string regexImgSrc = @"<meta property.*?>";
但有时我得到另一种格式meta标签从HTML这样的:
<meta data-react-helmet="true" property="article:publisher" content=""/>
所以正则表达式是不获得预期的产出。 我只需要属性名称和meta标签中的内容。 这里是我的代码
string regexImgSrc = @"<meta property.*?>";
MatchCollection matches = Regex.Matches(htmldata, regexImgSrc, RegexOptions.IgnoreCase | RegexOptions.Singleline);
请帮
在此先感谢
不建议使用正则表达式解析HTML。 html不规则,正则表达式用于正则表达式。 – jdweng
为什么你不使用HTML解析库(Html Agility Pack)。它只是一个建议 –
不,我不想使用任何库或第三方工具@Usman – sachin