2016-08-09 127 views
1

我处理字符串,如下面的冗余信息:0022 GMT (0822 HKT) July 21, 2016解析与乔达时间

显然,这些字符串指定一天的时间两次,两个不同的时区。 Joda Time的DateTimeFormat.forPattern()的模式语法可以处理这种冗余信息吗?

一种可能性是忽略两个时间表达式0022 GMT0822 HKT中的一个。这需要某种通配符,它​​可以匹配时间表达式的一部分以被忽略,看起来像Hm z '(*)' MMM dd, y

在Joda Time的模式语法中是否存在可以解析上述时间字符串的通配符或其他任何内容?

回答

1

为了忽略潜在矛盾的部分(重复在其他区的小时,分​​钟和区域名称),你必须写自己的DateTimeParser乔达时间

DateTimeFormatter dtf = 
    new DateTimeFormatterBuilder().appendPattern("HHmm 'GMT' (").append(
     new DateTimeParser() { 
      @Override 
      public int estimateParsedLength() { 
       return 10; 
      } 
      @Override 
      public int parseInto(DateTimeParserBucket bucket, String text, int position) { 
       int pos = position; 
       while (text.charAt(pos) != ')') { 
        pos++; 
       } 
       return pos; 
      } 
     } 
    ) 
    .appendPattern(") MMMM dd, yyyy") 
    .toFormatter() 
    .withLocale(Locale.US) 
    .withZoneUTC(); 

String input = "0022 GMT (0822 HKT) July 21, 2016";  
DateTime dt = dtf.parseDateTime(input); 
System.out.println("Joda: " + dt); // 2016-07-21T00:22:00.000Z 

为了您的信息,我没有办法在Java-8(没有输入预处理)的情况下执行此操作,请参阅此示例,即使使用可选部分,该示例也会抛出异常。 Java-8缺乏一种编写自己的解析器的机制。

DateTimeFormatter dtf = 
    DateTimeFormatter.ofPattern("HHmm z ([HHmm z]) MMMM dd, uuuu", Locale.US); 
ZonedDateTime zdt = ZonedDateTime.parse(input, dtf); // throws exception!!! 
// java.time.format.DateTimeParseException: 
// Text '0022 GMT (0822 HKT) July 21, 2016' could not be parsed at index 10 

边注:当你可能会探索我的图书馆Time4J它提供了一个可供选择,适合更高性能的解析引擎的Java-8,那么它提供了比乔达时更容易的解决方案,看到这个小gist example

否则写一个使用hackish的解决方法串预处理始终是可能的(有趣的时,不允许第三方库):

String input = "0022 GMT (0822 HKT) July 21, 2016"; 
StringBuilder sb = new StringBuilder(); 
boolean markedForRemoval = false; 
for (int i = 0; i < input.length(); i++) { 
    char c = input.charAt(i); 
    if (c == ')') { 
     markedForRemoval = false; 
    } 
    if (!markedForRemoval) { 
     sb.append(c); 
    } 
    if (c == '(') { 
     markedForRemoval = true; 
    } 
} 
input = sb.toString(); 
System.out.println(input); // 0022 GMT() July 21, 2016 
// continue parsing the changed input based on a formatter of your choice