2012-10-27 29 views
0

看来wget无法获得asp文件,而html没有问题。我已经写了一个脚本来wget一些URL并将它们保存为csv格式。 脚本是wget无法保存asp页面

wget -qO- http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1 | sed 's+<br />++g' > $1.csv 
+0

你可以发布你的整个脚本?另外:'wget'那个网页对我来说工作得很好。但是服务器返回的页面不是CSV格式 - 引入了额外的'
'标签,每行似乎都以不必要的逗号结尾。 –

+0

@ Xavier Holt:张贴编辑 – mahmood

回答

1

你必须把引号围绕该URL!如果没有加引号,Bash(或者你正在使用的任何shell)会将&视为在后台运行wget的请求 - 并且&之后的格式参数不会发送到服务器。试试这个:

wget -qO- 'http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1' | sed 's+<br>++g' > $1.csv 

请注意,我调整你的sed命令,太 - <br>是你正在越来越没有终止斜线。另外:删除那些<br> s意味着只有每个其他行都有数据。希望这不会成为问题,因为使用sed删除换行符有点痛苦,但如果是这样,请参阅this question了解如何操作。

希望有帮助!