0
看来wget
无法获得asp
文件,而html
没有问题。我已经写了一个脚本来wget一些URL并将它们保存为csv
格式。 脚本是wget无法保存asp页面
wget -qO- http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1 | sed 's+<br />++g' > $1.csv
看来wget
无法获得asp
文件,而html
没有问题。我已经写了一个脚本来wget一些URL并将它们保存为csv
格式。 脚本是wget无法保存asp页面
wget -qO- http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1 | sed 's+<br />++g' > $1.csv
你必须把引号围绕该URL!如果没有加引号,Bash(或者你正在使用的任何shell)会将&
视为在后台运行wget
的请求 - 并且&
之后的格式参数不会发送到服务器。试试这个:
wget -qO- 'http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1' | sed 's+<br>++g' > $1.csv
请注意,我调整你的sed
命令,太 - <br>
是你正在越来越没有终止斜线。另外:删除那些<br>
s意味着只有每个其他行都有数据。希望这不会成为问题,因为使用sed
删除换行符有点痛苦,但如果是这样,请参阅this question了解如何操作。
希望有帮助!
你可以发布你的整个脚本?另外:'wget'那个网页对我来说工作得很好。但是服务器返回的页面不是CSV格式 - 引入了额外的'
'标签,每行似乎都以不必要的逗号结尾。 –
@ Xavier Holt:张贴编辑 – mahmood