如何使用apache tika解析.Pst文件 1.2?
如何在使用ljcene进行搜索时获取整个主体,附件和电子邮件的所有元数据?如何从中提取内容。使用apache tika的Pst文件?
for (File file : docs.listFiles()) {
Metadata metadata = new Metadata();
ContentHandler handler = new BodyContentHandler();
ParseContext context = new ParseContext();
Parser parser = new AutoDetectParser();
InputStream stream = new FileInputStream(file);
try {
parser.parse(stream, handler, metadata, context);
}
catch (TikaException e) {
e.printStackTrace();
}
catch (SAXException e) {
e.printStackTrace();
}
雅我与自动检测解析器尝试(File file:docs.listFiles()){ 元数据元数据=新的元数据();与BodyContenthandle,元数据和文档对象 – user2857190
。 ContentHandler handler = new BodyContentHandler(); ParseContext context = new ParseContext(); 解析器解析器= new AutoDetectParser(); InputStream stream = new FileInputStream(file); \t \t \t尝试{ \t \t \t \t parser.parse(流,处理程序,元数据,背景); \t \t \t} \t \t \t赶上(TikaException E){ \t \t \t \t e.printStackTrace(); \t \t \t}赶上(SAXException的发送){ \t \t \t \t e.printStackTrace(); \t \t \t} – user2857190