2011-06-08 217 views
0

即时通讯使用Asp.net和C#,并能够获得一个HTML文件的文件中使用webrequest和webresponse的HTML页面的源代码,现在我想只获得一些元素或html标签,而不是整个源代码,可以任何1在这帮助我?如果可能的话,我们可以将元素和值保存在mysql数据库中。建议如果有任何有用的参考链接?如何从HTML页面源获取特定的html div标签?

+0

为了能够回答这个问题,你需要提供你需要从页面中提取的例子。 – 2011-06-09 02:15:03

回答

1
+0

@感谢Daniel A White,但是在这部分中,我使用了HTML敏捷包,这是他们获得直接代码或简单代码的可能性,我可以直接在asp.net上使用,但我很短时间就可以使用它。 .. – thechoosenone 2011-06-08 17:54:05

-2

您需要将HTML与正则表达式匹配,然后将结果保存到所需位置。

参见:http://haacked.com/archive/2004/10/25/usingregularexpressionstomatchhtml.aspx

+2

正则表达式不是获取html的好方法 – 2011-06-08 16:56:33

+1

取决于项目的范围它可以正常工作。 – 2011-06-08 17:27:03

+0

虽然这是事实,但您不能使用正则表达式来正确*解析HTML,它们是一个*优秀的*工具,用于从格式良好的HTML中提取已知元素。 – 2011-06-09 02:14:18

-4

这里是对整个教程,但该链接提供目前你问的话题,应该有一些例子太

http://www.tizag.com/htmlT/htmldiv.php

<div id="menu" align="right" > 
<a href="">HOME</a> | 
<a href="">CONTACT</a> | 
<a href="">ABOUT</a> | 
<a href="">LINKS</a> 
</div> 

<div id="content" align="left" > 
<h5>Content Articles</h5> 
<p>This paragraph would be your content 
paragraph with all of your readable material.</p> 
<h5 >Content Article Number Two</h5> 
<p>Here's another content article right here.</p> 
</div> 
+1

,它不回答OP的问题 – 2011-06-08 17:11:15