我有一个HTML响应正文/字符串。该HTML内容的部分是这些字符串 -需要正则表达式html帮助
<h2><a href="javascript:;" class="user-name-class">MY_USER_NAME<b></b></a></h2>
["media_detail","init",[false,"",null,true,1,4,"99999_XXXXX_99999",11836530,"00076f7474727febc37a8825d373a5be","\/p\/LdvJWSF-6b\/","\/accounts\/login\/"]],
从这些我需要提取MY_USER_NAME
和99999_XXXXX_99999
我希望从正则表达式的摇滚明星的帮助。这是红宝石1.9.3。谢谢。
更新:我们使用正则表达式,因为这不是实时完成的,所以性能不是问题。
我不会用正则表达式这一点。使用HTML/XML解析器。 –
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – Gus
这不是一个性能问题。正则表达式只是**无法正确解析HTML。甚至没有提到可由DOM解析器处理的无效HTML。 –