到目前为止,我一直使用wget和curl来做屏幕抓取。现在我想切换到Perl。什么是一个很好的教程,将涵盖perl中的基本web编程(最好不要重述基础知识)?我说的是基本的东西,喜欢把自己和解析页面,提交表单,代理等perl网络教程
Q
perl网络教程
1
A
回答
0
工具,你需要的Perl之外:
- HTTP实时头(Firefox扩展)或当量。以反向工程JavaScript请求原始GET/POST,所以你可以模仿与Mechanize或LWP等
- 正如其他海报已经提到的,一个好的无头浏览器是
WWW::Mechanize
模块。 - 我建议花一些时间学习
HTML::TreeBuilder
&特别是HTML::TreeBuilder::XPath
和HTML::Query
。当您希望从HTML文档获取实际数据时,最后两个将变得非常方便。 HTML::TableExtract
也是一个很好的模块,可以在需要时从HTML表格中提取数据。
基本上,使用上述所有功能将使您能够抓取大多数网站。
有乐趣爬行( - :
1
2
我过去使用过WWW-Mechanize来实现基本的网页抓取功能,包括表单提交等。
还有一些不错的examples。
相关问题
- 1. 是否有关于Perl网络编程的最新教程?
- 2. 贝叶斯网络教程
- 3. Java网络/套接字编程教程
- 4. Perl UMMF教程?
- 5. 从网络中缺少的Android教程
- 6. PHP网络抓取教程失败
- 7. 亚马逊网络服务+ iphone教程
- 8. Asp.net网络服务视频或教程
- 9. Matlab 7.0.4神经网络工具教程
- 10. gtk网络教程/资源/例子
- 11. 寻找Drupal网络形式教程
- 12. Spring框架的网络教程404
- 13. 英雄之旅教程与“角内存网络-API”教程问题
- 14. C/C++/C#TCP/IP和网络编程(多平台)的教科书或教程
- 15. 在网络上使用perl
- 16. 递归网络爬虫perl
- 17. WebCenter网站教程?
- 18. 神经网络教学:双极XOR
- 19. 春季:有没有简单的非网络教程?
- 20. 关于使用PHP和MySQL创建社交网络的教程?
- 21. 寻找一个简单的Python/MongoDB的网络教程
- 22. 什么是iPhone上的点对点网络的好教程?
- 23. 语言独立教程或网络应用书
- 24. Firefox网络扩展教程:剧本重演
- 25. 有创建贝叶斯网络的一步一步教程吗?
- 26. Tensorflow无法运行广泛而深入的网络教程
- 27. 我正在寻找网络爬虫教程
- 28. Google Compute Engine Bookshelf教程:npm ERR!网络阅读ECONNRESET
- 29. MVC3网络应用程序/教程将不会“在IIS7网络服务器上使用ASPNETDB.mdf”登录“
- 30. 网络程度
网络::查询支持比HTML ::查询更复杂的选择,因为它没有实现这种对自己,但代表这一部分,以优良的功能完整的HTML ::选择:: XPath的。 – daxim 2011-05-18 11:08:12