2015-07-12 20 views
0

我想在chrome检查元素上提取网站的完整html源代码。如何从网站中提取源代码,因为我们在检查元素中看到的内容

我想废钢disqus的意见从http://bossip.com/1190557/cops-kill-people-mississippi-cop-under-investigation-for-strangling-unarmed-black-man-jonathan-sanders-to-death-43081/

起初我试图用Java和Jsoup但我无法提取完整的HTML源。

然后如How to get html that I see in inspect element?建议我尝试使用HTML单元,但不幸的是HTML单元也没有按照我的预期提取。

有没有解决这个问题的方法?

+0

“页面另存为”,在你的浏览器? –

+0

有没有Java库可以做到这一点? –

+0

@ Nick.McDermaid即使手动保存,我没有找到预期的内容,我在谷歌Chrome –

回答

-1

在Chrome中,

    正常的浏览器文件中
  1. :元素上单击鼠标右键,然后从弹出菜单中选择“检查元素”。您将转到“开发人员工具”窗口。
  2. 在开发人员工具窗口中:右键单击HTML元素并从弹出菜单中选择“编辑为HTML”。
  3. 选择在编辑器中(按Ctrl-A)的所有HTML文本复制到剪贴板(按Ctrl-C)
+1

不知道为什么这是downvoted。它按照所述的方式工作 – geert3

+0

因为@Arun Kishore询问如何获得一个非常特定页面的html,所以你的解决方案效果很好,但倒票可能是由于这是一个手动任务。它不能自动化。 –

相关问题