-3
Q
如何抓取网站?
A
回答
2
那么RSS提要(大概)包含的链接是文章链接,所以它(大概)归结为你的意思是“读”。
如果您只是需要获取它们,请使用
URL.getInputStream
或其他一些HTTP客户端库。如果您想显示最终用户阅读的新闻文章页面,那么您只需要在本机浏览器中打开该URL即可。
如果你想提取文章文本,那么你需要使用合适的HTML解析器解析HTML,或者使用忽略HTML结构的kludgey文本模式识别(blech!)。
相关问题
- 1. scrapy抓取网站
- 2. 安装抓取,网站抓取库
- 3. 网站抓取器每隔几秒就抓取一次网站
- 4. 如何抓取SimpleHTMLDom返回的网站?
- 5. 如何抓取我自己的网站?
- 6. 如何抓取一个网站
- 7. 如何抓取网站证书?
- 8. 如何抓取分类的网站
- 9. 如何从网站上抓取数据
- 10. 如何从网站上抓取信息?
- 11. 如何抓取Hype Machine等网站?
- 12. 搜索引擎如何抓取网站?
- 13. 如何使用scrapy抓取网站?
- 14. 如何解析/抓取/抓取特定信息的网站?
- 15. 网站抓取问题网站
- 16. 我如何从Python网站抓取网站上的pdf链接
- 17. 我如何从R网站抓取这个网站的信息?
- 18. apache nutch不抓取网站
- 19. 抓取网站使用PHP
- 20. 网站抓取和截图
- 21. 抓取整个网站python
- 22. 网站内容抓取
- 23. 从网站抓取数据
- 24. 从网站抓取文本
- 25. 从网站抓取数据
- 26. Scrapy - 抓取和刮网站
- 27. 从网站抓取图片
- 28. 从网站抓取TEXT ONLY
- 29. 如何抓取网站并截取每个网页的截图?
- 30. 软件抓取/抓取网站的网址