2012-02-13 159 views
1

我有字符串,我需要分割它两次,选择特殊字符后面的部分。C#正则表达式分割和正则表达式

比方说:

string myString = "Word 2010|82e146e7-bc85-4bd4-a691-23d55c686f4b;#Videos|55140947-00d0-4d75-9b5c-00d8d5ab8436"; 

string[] guids = Regex.Split(myString,";#"); 

所以在这里我得到与价值+ GUID两个元素的数组。但我只需要的GUID,如:

[0] 82e146e7-bc85-4bd4-a691-23d55c686f4b

[1] 55140947-00d0-4d75-9b5c-00d8d5ab8436

任何方式做一两行?

+1

有一件事值得一提的是,使用' Regex.Split'(在上面的上下文中)而不是'String.Split'是毫无意义的(我怀疑会有更多的开销)。我个人只有两个功能,一个按照上面的方式拆分,另一个在管道上拆分。 – Chris 2012-02-13 17:27:47

回答

5

你可以做到这一点,但仅仅是因为你可以做到在同一行,并不意味着你应该(可读性进场,如果你太看中这里)。这里显然没有验证。

string myString = "Word 2010|82e146e7-bc85-4bd4-a691-23d55c686f4b;#Videos|55140947-00d0-4d75-9b5c-00d8d5ab8436"; 

string[] guids = Regex.Split(myString, ";#") 
         .SelectMany(s => Regex.Split(s, @"\|").Skip(1)) 
         .ToArray(); 

Assert.AreEqual(2, guids.Length); 
Assert.AreEqual("82e146e7-bc85-4bd4-a691-23d55c686f4b", guids[0]); 
Assert.AreEqual("55140947-00d0-4d75-9b5c-00d8d5ab8436", guids[1]); 
3

你可以很容易地做到这一点没有一个正则表达式,如果每个的最后部分始终是一个GUID:

string[] guids = String.Split(";").Select(c => c.Substring(c.Length - 36)).ToArray(); 
0
string[] guids = myString.Split(';').Select(x => x.Split('|')[1]).ToArray(); 
0
string myString = "Word 2010|82e146e7-bc85-4bd4-a691-23d55c686f4b;#Videos|55140947-00d0-4d75-9b5c-00d8d5ab8436"; 

//split the string by ";#" 
string[] results = myString.Split(new string[] { ";#" }, StringSplitOptions.RemoveEmptyEntries); 

//remove the "value|" part 
results[0] = results[0].Substring(results[0].IndexOf('|') + 1); 
results[1] = results[1].Substring(results[1].IndexOf('|') + 1); 

//Same as above, but in a for loop. usefull if there are more then 2 guids to find 
//for(int i = 0; i < results.Length; i++) 
// results[i] = results[i].Substring(results[i].IndexOf('|') + 1); 

foreach(string result in results) 
    Console.WriteLine(result); 
0
var guids = Regex 
    .Matches(myString, @"HEX{8}-HEX{4}-HEX{4}-HEX{4}-HEX{12}".Replace("HEX", "[A-Fa-f0-9]")) 
    .Cast<Match>() 
    .Select(m => m.Value) 
    .ToArray();