如何使用HTML解析器获取给定URL的网页标题?是否可以使用正则表达式来获得标题?我宁愿使用HTML解析器。如何使用html解析器获取网页标题
我在Java Eclipse IDE中工作。
我已经尝试使用下面的代码,但不成功。
任何想法?
提前致谢!
import org.htmlparser.Node;
import org.htmlparser.Parser;
import org.htmlparser.util.NodeList;
import org.htmlparser.util.ParserException;
import org.htmlparser.tags.TitleTag;
public class TestHtml {
public static void main(String... args) {
Parser parser = new Parser();
try {
parser.setResource("http://www.yahoo.com/");
NodeList list = parser.parse(null);
Node node = list.elementAt(0);
if (node instanceof TitleTag) {
TitleTag title = (TitleTag) node;
System.out.println(title.getText());
}
} catch (ParserException e) {
e.printStackTrace();
}
}
}
[你不能解析HTML或XML定期expresisons] [1] [1]:http://stackoverflow.com/questions/ 1732348 /正则表达式匹配开放标签,除了-XHTML-自足标签/ 1732454#1732454 – Glyph 2011-10-16 03:49:55