没有HTML标签的wget

有没有一种方法可以获得html页面的主体，而不需要html标签？没有HTML标签的wget

curl和wget返回响应，但包含HTML标签。我们可以使用sed和awk去除标签，但是我正在寻找一种现有的工具，它可以在没有sed和awk的情况下完成。

lynx是一个选项，但它没有预先安装。

谢谢！

2013-09-27 shan

为什么厌恶安装合适的工具？

作为l alternative的替代品，尝试w3m，例如，

w3m -dump http://google.com

2013-09-27 16:37:50

我对安装工具没有反感。在安装任何其他软件包之前，只需要知道是否有现有的工具 – shan

Converting HTML to plain text in PHP for e-mail列出了几种工具一样，How can I Convert HTML to Text in C#?。但是，如果lynx -dump做你想要的，那么这可能是最好的安装工具。

2013-09-28 09:59:56 Joe

回答