我想找到其中包含BeautifulSoup4文本和一些噪音的链接:查找其文本的文本有可能包含噪声
<a href="#">
<span>gggggggggggg</span>
Some text123
<div>fdsfdsfdsfd</div>
<span> fdsfdsfdsfd</span>
</a>
当我试图通过“有些text123”找到它,它失败:
soup123.find("a", "Some text123") # => NoneType
这是什么解决方案?
更新:
的“一”是不是单一的一个,可以有很多。但带有“一些text123”的“a”是独一无二的。
用'soup123.find尝试( “A”,文本= re.compile (“一些text123”))' – Fejs
请发布真正的html代码 –
@Fejs我试过并没有收到任何东西 –