我正在尝试将与人共享的对话的聊天记录放在一起。我希望能够通过名称,时间和文本来分解它。由于我拉的对话不是一个漂亮而整齐的CSV文件,我需要从源代码中删除。我得到如下代码。有什么办法可以将<div class='message'>
和</p>
之间的所有字符串都拉出来,这样我就可以将每个聊天消息与相应的发件人和时间发送到一起了吗?谢谢!获取两个不同标签之间的所有字符串
<div class="message"><div class="message_header"><span class="user">First Lastname</span><span class="meta">Tuesday, January 1, 2000 at 5:00pm EST</span></div></div><p>text here</p>
使用beautifulsoup对结构化文档进行操作,而不是试图写一个正则表达式:https://www.crummy.com/software/BeautifulSoup/ – thaavik
你想要什么拉出来的吗?邮件标题,时间和名称? – shockawave123
我想拉class =“user”,class =“meta”,以及
和
之间的任何东西。可能没有段落标签之间的文本.... – Phum