我需要为自己放置一个小项目,并且我需要一些功能来下载页面以供离线查看。是否有一个库可以下载给定的页面及其嵌入的图像,并编辑img标签以反映图像的本地位置。网站下载库
我知道那里有很多网站下载,但我找不到可以直接在我的代码中使用的东西。
我有一些基本的脚本在Python中完成,所以Python非常欢迎。但几乎任何语言都可以。
我需要为自己放置一个小项目,并且我需要一些功能来下载页面以供离线查看。是否有一个库可以下载给定的页面及其嵌入的图像,并编辑img标签以反映图像的本地位置。网站下载库
我知道那里有很多网站下载,但我找不到可以直接在我的代码中使用的东西。
我有一些基本的脚本在Python中完成,所以Python非常欢迎。但几乎任何语言都可以。
是,BeautifulSoup +蟒蛇urllib模块我能想到的
您正在寻找BeautifulSoup。
python web爬虫怎么样? http://code.google.com/p/pywebcrawler/
OR,海葵(红宝石)? http://anemone.rubyforge.org/
简单的解决方案。
wget -p example.com