我使用pdfbox从pdf文件获取数据 我正在使用selenium webdriver将该数据与网页数据进行比较。 我可以从两者中获取数据。 我用包含方法来比较两个数据。 Java是能够比较glädjande类型的数据,但是当Kommunstyrelsensordförande用作句子其不能够匹配。然而ordförande作为一个单词可以匹配。 我也试过Java无法比较pdfbox中的ö(瑞典字符)
PDFTextStripper pdfStripper = new PDFTextStripper("ISO8859_1");
但无法使用contains方法来匹配数据。
@Test \t公共无效TCTwoStringCompare() \t { \t \t字符串STR1 = “KommunstyrelsensordförandeKommunstyrelsensordförande”; \t \t String str2 =“KommunstyrelsensordförandeKommunstyrelsens”; \t System.out.println(str1.contains(str2)); \t} //这是工作 – 2014-09-30 06:52:43
试一试并打印出两个字符串的字符代码。也许在一种情况下,你没有'ö',而是一个'ő'。 – mkl 2014-09-30 07:13:10
我已经使用过PDFTextStripper pdfStripper =新PDFTextStripper(“ISO-8859-1”);为瑞典语。我怎样才能知道字符串 – 2014-09-30 07:29:36