我有一个很大的字符串 - html页面。我需要找到闪存驱动器的所有名称,即 ,即我需要在双引号之间获得内容:data-name="USB Flash-drive Leef Fuse 32Gb">
。所以我需要一个data-name="
和">
之间的字符串。请不要提及BeautifulSoup,我需要在不使用BeautifulSoup的情况下完成,没有正则表达式就更好,但是也可以接受正则表达式。Python。如何查找匹配子串的所有匹配项?
我试图用这样的:
p = re.compile('(?<=")[^,]+(?=")')
result = p.match(html_str)
print(result)
在HTML上使用DOM解析器来提取属性的值有什么问题? –
@Vasili Syrakis我有一定的任务 - 使用python。 –
fyi bs4 = python;看到这个链接的第一段:https://www.crummy.com/software/BeautifulSoup/bs4/doc/ –