2013-08-04 46 views
0

我坚持这个正则表达式问题在我的vb.net项目...正则表达式部分工作,并给我我不想要的数据!正则表达式来获取在vb.net html特定的数据

HTML代码示例如下所示:

<div id="card105148" class="cards">...</div> 

...

有很多的div但只有id和类的变化。该ID是allways“卡+(随机数),并且该类可以是”卡“或”cardsp“。

我想要做的是抓取”卡(XXXXXXX)“后的ID而做到这一点的每个而言DIV

我的vb.net代码如下所示:!``

Dim r As New System.Text.RegularExpressions.Regex("<div id=""card(.*?)""  class=""cards(.*?)"">") 
    Dim matches As MatchCollection = r.Matches(theusercp) 

    For Each itemcode As Match In matches 

     ListBox2.Items.Add(itemcode.Value.Split("""").GetValue(1)) 

    Next 

正如我所说的,当我运行的代码,我得到的结果,但我让他们带例如: 例如:

1->> card105148 2->> card105132 3->> card153245 

我只需要没有文字的号码。

theusercp包含所有的html源代码。

请帮忙来完成这个任务!另外,如果需要,我已准备好更改代码!

回答

0

而不是

itemcode.Value.Split("""").GetValue(1) 

尝试

itemcode.Groups(1).ToString() 
+0

谢谢很多!它工作!我现在只能得到这些数字。 – user2650060