2014-09-29 70 views
4

我收到邮件存档与这样的日期在其中。字符串到UTC时间转换

Wed, 17 Dec 1997 13:36:23 +2 
Mon, 16 Jun 1997 15:41:52 EST 
Tue, 15 Jul 1997 14:37:00 EDT 
Tue, 5 Aug 1997 08:37:56 PST 
Tue, 5 Aug 1997 15:46:16 PDT 
Thu, 5 Mar 1998 08:44:19 MET 
Mon, 8 Nov 1999 17:49:25 GMT 
Thu, 24 Feb 94 20:06:06 MST 
Mon, 19 Dec 2005 14:17:06 CST 
Thu, 14 Sep 95 19:15 CDT 
Sat, 22 Feb 1997 05:16:55 UT 
Mon, 8 Jul 1996 15:48:54 GMT-5 
Mon, 25 Nov 1996 17:10:28 WET 
Mon, 6 Jan 1997 23:43:48 UT 
Fri, 13 Jun 1997 16:44:03 -0400 

问题是将此时间转换为UTC。这就是我想要做到的。

static void Main(string[] args) 
{ 
    var possibleValues = new string[] 
    { 
     "Mon, 29 Sep 2014 08:33:35 +0200" 
     , "Fri, 29 Jun 2001 07:53:01 -0700" 
     ,"Fri, 26 Sep 2014 15:57:04 +0000" 
     ,"Wed, 17 Dec 1997 13:36:23 +2" 
     , "Fri, 13 Jun 1997 16:44:03 -0400" 

     , "Mon, 16 Jun 1997 15:41:52 EST" 
     , "Tue, 15 Jul 1997 14:37:00 EDT" 
     , "Tue, 5 Aug 1997 08:37:56 PST" 
     , "Tue, 5 Aug 1997 15:46:16 PDT" 
     , "Thu, 5 Mar 1998 08:44:19 MET" 
     , "Mon, 8 Nov 1999 17:49:25 GMT" 
     , "Thu, 24 Feb 94 20:06:06 MST" 
     , "Mon, 19 Dec 2005 14:17:06 CST" 
     , "Thu, 14 Sep 95 19:15:00 CDT" 
     , "Sat, 22 Feb 1997 05:16:55 UT" 
     , "Mon, 8 Jul 1996 15:48:54 GMT-5" 
     , "Mon, 25 Nov 1996 17:10:28 WET" 
     , "Mon, 6 Jan 1997 23:43:48 UT" 

    }; 

    foreach (var item in possibleValues) 
    { 
     var dateParts = item.Split(' '); 
     var lastItem = dateParts[dateParts.Length - 1]; 
     if (lastItem.StartsWith("+") || lastItem.StartsWith("-")) 
     { 
      try 
      { 
       DateTimeOffset offset = DateTimeOffset.Parse(item, CultureInfo.InvariantCulture); 
       Debug.WriteLine("Input: {0}, UTC Time: {1}", item, offset.UtcDateTime); 
      } 
      catch (Exception exc) 
      { 
       Debug.WriteLine("Failed - {0}, Error Message: {1}", item, exc.Message); 
      } 
     } 
     else 
     { 
      //Sometimes year is a two digit number and sometimes it is 4 digit number. 
      string dateFormat = string.Format("ddd, {0} MMM {1} {2}:mm:ss {3}", new string('d', dateParts[1].Length), new string('y', dateParts[3].Length), int.Parse(dateParts[4].Substring(0, 2)) > 12 ? "HH" : "hh", lastItem);  
      try 
      { 
       DateTimeOffset offset = DateTimeOffset.ParseExact(item, dateFormat, CultureInfo.InvariantCulture, DateTimeStyles.None); 
       Debug.WriteLine("Input: {0}, UTC Time: {1}", item, offset.UtcDateTime); 
      } 
      catch (Exception exc) 
      { 
       Debug.WriteLine("Failed - {0}, DateFormat Tried: {1}, Error Message: {2}", item, dateFormat, exc.Message); 
      } 
     } 
    } 
} 

我无法弄清楚如何处理所有情况。我也愿意使用野田时间。

我已经通过许多来自SO和谷歌的链接找到这个答案,但无法实现这些链接的任何答案。如果你知道类似的问题,请让我知道。

我已经通过下面的链接。

Convert.ToDateTime Method
Converting between types
daylight-saving-time-and-time-zone-best-practices
SO Tags timezone
Coding Best Practices Using DateTime in the .NET Framework
conversion-of-a-utc-date-time-string-in-c-sharp

+0

我编辑了你的标题。请参阅:“[应该在其标题中包含”标签“](http://meta.stackexchange.com/questions/19190/)”,其中的共识是“不,他们不应该”。 – 2014-09-29 17:36:20

+0

@JohnSaunders,谢谢我会牢记这一点。 – ndd 2014-09-29 17:38:55

+0

除了时区缩写“WET”和“MET”之外,这些字符串似乎大部分都符合RFC 822/1123标准。此外,格式“GMT-5”和“+2”的偏移量没有规定,因为该格式要求值为+0100“。 – 2014-09-29 17:41:19

回答

3

这些日期似乎大多是符合RFC 822 §5.1RFC 1123 §5.2.14修正。

但是,指定的几个时区不符合规定。

  • “WET” 通常是0000
  • “MET” 是罕见的,但被示出为here 0100。
  • “GMT-5” 应写为 “-0500”
  • “+2” 应写为 “+0200”

该格式只提供定义为:

  • “UT”/ “GMT”= 0100
  • “EDT”= -0400
  • “EST”/ “CDT”= -0500
  • “CST”/ “MDT”= -0600
  • “MST”/ “PDT”= -0700
  • “PST”= -0800

注意,在正常情况下,任何时区缩写可能是不明确的。例如,“CST”有5种不同的含义,您可以看到in this list。只有在这种特定的格式中,缩写才具有特定的上下文。换句话说,虽然“CST”是中国标准时间的有效缩写,但绝不会使用RFC822/1123格式值中的CST。相反,你会使用“+0800”。

现在在.NET中,RFC822/1123格式由"R" standard format specifier覆盖。通常,您可以拨打DateTimeOffset.ParseExactDateTime.ParseExact"R"说明符。但是,您将无法在此处使用该功能,因为它不识别“GMT”以外的任何时区缩写,也不适用于偏移量或两位数年份。

但是,非精确的解析器(DateTimeOffset.ParseDateTime.Parse)似乎确认了大多数重要的位,我们可以利用这一点。您必须执行一些预处理才能分配可识别的时区偏移量。

private static readonly Dictionary<string,string> TZMap = new Dictionary<string, string> 
{ 
    // Defined by RFC822, but not known to .NET 
    {"UT", "+0000"}, 
    {"EST", "-0500"}, 
    {"EDT", "-0400"}, 
    {"CST", "-0600"}, 
    {"CDT", "-0500"}, 
    {"MST", "-0700"}, 
    {"MDT", "-0600"}, 
    {"PST", "-0800"}, 
    {"PDT", "-0700"}, 

    // Extraneous, as found in your data 
    {"WET", "+0000"}, 
    {"MET", "+0100"} 
}; 

public static DateTimeOffset Parse(string s) 
{ 
    // Get the time zone part of the string 
    var tz = s.Substring(s.LastIndexOf(' ') + 1); 

    // Replace time zones defined in the map 
    if (TZMap.ContainsKey(tz)) 
    { 
     s = s.Substring(0, s.Length - tz.Length) + TZMap[tz]; 
    } 

    // Replace time zone offsets with leading characters 
    if (tz.StartsWith("GMT+") || tz.StartsWith("GMT-") || tz.StartsWith("UTC+") || tz.StartsWith("UTC-")) 
    { 
     s = s.Substring(0, s.Length - tz.Length) + tz.Substring(3); 
    } 

    DateTimeOffset dto; 
    if (DateTimeOffset.TryParse(s, CultureInfo.InvariantCulture, DateTimeStyles.None, out dto)) 
    { 
     return dto; 
    } 

    throw new ArgumentException("Could not parse value: " + s); 
} 

这会传递您提供的所有示例值,但您可能会发现更多无关值,您需要将其添加到地图中。在识别所有边缘案例之前,可能需要经过数据才能通过数据。

当然,既然您在这里找回DateTimeOffset,如果您需要UTC值,您可以使用.UtcDateTime.ToUniversalTime()

+0

@mattjohson运行上面的代码后,我注意到我得到不同的结果,这可能是我可能有错误,但我在发布问题之前仔细检查了我的答案,所以你可以帮助验证答案吗? http://i.stack.imgur.com/2o6E1.png – ndd 2014-09-29 19:10:43

+0

这两个输入值与我看起来完全相同。他们应该产生相同的输出。我在这里给出的方法应该给出一个带有8:33:35和+02:00偏移量的“DateTimeOffset”。调用'.UtcDateTime'会给6:33:35。我不确定你如何得到12:33:35。 – 2014-09-29 19:17:16

+0

哦,我现在看到,你正在比较你的原始代码和我的答案。您的原始代码有缺陷,因为您正在'DateTime'实例上调用'.ToUniversalTime()'。这将假定该值位于正在运行的计算机的本地时区中。你不想这样做。你可以在'DateTimeOffset'实例上调用它,而不是'DateTime'。错误与'offset.DateTime.ToUniversalTime()'有关。它应该只是'offset.ToUniversalTime()' – 2014-09-29 19:20:22