保留使用锅炉的样板

另外，它是否包含对每个文本块的某种信心，以确定它是否是样板文件？

谢谢。

2013-10-01 abhinavkulkarni

你可以得到整个文本或使用文档类样板穿越的实际文本块规定：

final HTMLDocument htmlDoc = HTMLFetcher.fetch(new URL(url)); 
final TextDocument doc = new BoilerpipeSAXInput(htmlDoc.toInputSource()).getTextDocument(); 
// doc.getText(true, true) will give you all the text 
// doc.getTextBlocks will let you traverse the document

来源

2013-10-21 08:57:22 synhershko

保留使用锅炉的样板

回答

相关问题