我有HTML作为字符串,我想从中提取“post_titles”。这是HTML字符串:如何从HTML中提取内容
<div class="hidden" id="inline_49">
<div class="post_title">Single parenting</div>
<div class="post_name">single-parenting</div>
<div class="post_author">90307285</div>
<div class="comment_status">open</div>
<div class="ping_status">open</div>
<div class="_status">publish</div>
<div class="jj">20</div>
<div class="mm">07</div>
<div class="aa">2015</div>
<div class="hh">00</div>
<div class="mn">52</div>
<div class="ss">33</div>
这有一个职位的标题为“单亲”,这是我想要提取的。这是我正在使用的:
Elements link = doc.select("div[class=post_title]");
String title = link.text();
但是这是一个空白字符串。我也试过:
Elements link = doc.select("div[id=inline_49]").select("div[class=post_title]");
String title = link.text();
这也给一个空白的字符串。请帮我选择一下我需要用来提取标题的选择器。
这是工作绝对好。现在我明白了问题所在。为了从该页面访问html内容(https://ssblecturate.wordpress.com/wp-login.php),我需要提供登录信息,这就是为什么它返回空字符串。 –
我也想问问在我的代码中是否有我的登录信息(id和密码)是好的做法。用户是否有能力使用这些信息并滥用我的博客网站? –