2013-09-27 64 views
0

有没有一种方法可以获得html页面的主体,而不需要html标签?没有HTML标签的wget

curl和wget返回响应,但包含HTML标签。我们可以使用sed和awk去除标签,但是我正在寻找一种现有的工具,它可以在没有sed和awk的情况下完成。

lynx是一个选项,但它没有预先安装。

谢谢!

回答

1

为什么厌恶安装合适的工具?

作为l alternative的替代品,尝试w3m,例如,

w3m -dump http://google.com 
+1

我对安装工具没有反感。在安装任何其他软件包之前,只需要知道是否有现有的工具 – shan