2012-04-19 144 views
0

我有一个需要解析的中文内容的文件。每篇文章都有一些奇怪的分隔字段,我试图隔离字段,但无法识别分隔符。用空格分隔符解析文件

Dim stringSplitter() as string = {" "} 
Try 
    sampleResults = entry.Split(stringSplitter,StringSplitOptions.RemoveEmptyEntries) 

..... 

发布内容的示例;

108087006686338t.qq.com/GAOCHUANG8899homeGAOCHUANG8899homehttp://t.qq.com/p/t/1080870066863382012-03-22 04:49:46 

隔板第一组数字108087006686338 DELIMITTER t.qq.com/GAOCHUANG8899home之后开始。我最初认为我可以使用json分割它,但这绝对不是json格式。

对不起,当我发布原始分隔符时消失时,使这个职位。该delimitter看起来像一个矩形块

编辑:我使用标识的字符的十六进制值01的十六进制编辑器

好了,它看起来像一个句点,但期间有2E的值。这对任何人都没有意义吗?

编辑:

再现问题:我可以拆分基于十六进制值的字符串。如果值是“01”,那么我将如何根据该值拆分字符串。

编辑:

最终的答案:'

Dim hvalue as Char = Char(1) 
Dim stringSplitter() as string = {hvalue} 
+0

示例内容中的“6338”和“t.qq.com”之间没有字符。你确定数据是分隔的吗?也许这些字段是基于位置的。 – 2012-04-19 14:31:34

+0

抱歉,伙计们;无论如何,无需粘贴即可显示原始文件。我尝试在我的代码中使用空格字符,但它在日期时间拆分字符串 – vbNewbie 2012-04-19 14:34:09

+0

将其格式化为代码。它将保留空格。 – 2012-04-19 14:35:35

回答

1

比方说,你必须输入$input和delimitter与01 ASCII码。

的Perl:

my $input = ... 
my @output = split(chr(01), $input); 
print "$_\t" for @output; # print all items 

上面的代码将分裂您$input@output阵列,这样,那么你可以通过

$output[0] # first item 
$output[1] # second item 
... 
$#output + 1 # number of items 

视觉工作室2010年访问项目:

Dim hvalue as Char = Char(1) 
Dim stringSplitter() as string = {hvalue} 
+0

非常感谢你....非常感谢。得到它的工作 – vbNewbie 2012-04-19 15:43:36