当我使用Apache提卡确定从内容的文件类型。 XML文件很好,但不是JSON。如果内容类型是json,它将返回“text/plain”而不是“application/json”。阿帕奇提卡和JSON
任何帮助?
public static String tiKaDetectMimeType(final File file) throws IOException {
TikaInputStream tikaIS = null;
try {
tikaIS = TikaInputStream.get(file);
final Metadata metadata = new Metadata();
return DETECTOR.detect(tikaIS, metadata).toString();
} finally {
if (tikaIS != null) {
tikaIS.close();
}
}
}
如果您没有处理文件,或者不能相信文件扩展名为提示,任何人都有建议吗? – milletron
@milletron通阿帕奇蒂卡文件的内容,它会做基于MIME魔力检测过 – Gagravarr
感谢@Gagravarr。是的,我可以通过十几个不同的字节流来推测整个MIME检测工作,但仍然不会将JSON与纯文本区分开来(至少为1.15)。我想有人会写一个类似于XML和HTML的新探测器?我只是感到惊讶JSON不包括已经。 – milletron