Q

如何从网站中提取源代码，因为我们在检查元素中看到的内容

2015-07-12 20 views 0 likes

0

我想在chrome检查元素上提取网站的完整html源代码。如何从网站中提取源代码，因为我们在检查元素中看到的内容

我想废钢disqus的意见从http://bossip.com/1190557/cops-kill-people-mississippi-cop-under-investigation-for-strangling-unarmed-black-man-jonathan-sanders-to-death-43081/

起初我试图用Java和Jsoup但我无法提取完整的HTML源。

然后如How to get html that I see in inspect element?建议我尝试使用HTML单元，但不幸的是HTML单元也没有按照我的预期提取。

有没有解决这个问题的方法？

2015-07-12 Arun Kishore

+0

“页面另存为”，在你的浏览器？ –

+0

有没有Java库可以做到这一点？ –

+0

@ Nick.McDermaid即使手动保存，我没有找到预期的内容，我在谷歌Chrome –

A

回答

-1

在Chrome中，

：元素上单击鼠标右键，然后从弹出菜单中选择“检查元素”。您将转到“开发人员工具”窗口。
在开发人员工具窗口中：右键单击HTML元素并从弹出菜单中选择“编辑为HTML”。
选择在编辑器中（按Ctrl-A）的所有HTML文本复制到剪贴板（按Ctrl-C）

2015-07-12 12:10:44 geert3

+1

不知道为什么这是downvoted。它按照所述的方式工作 – geert3

+0

因为@Arun Kishore询问如何获得一个非常特定页面的html，所以你的解决方案效果很好，但倒票可能是由于这是一个手动任务。它不能自动化。 –

相关问题