2012-09-21 131 views
1

HI我在C#领域非常新。自今年初以来一直在使用php和JavaScript。我想从博客中删除帖子和评论。该网站是http://www.somewhereinblog.net从网站上抓取C#数据

我想要做的就是 1.我要登录使用软件 2.然后下载HTML 3.然后使用正则表达式,XPath的一切来得心应手员额的内容分开和意见

我一直在寻找。很少理解。虽然我很确定我需要使用'htmlagilitypack'。我不知道如何添加一个库到C#控制台或表单应用程序。有人能给我一些帮助吗?我非常需要这个。而且我不会仅仅一个星期就进入C#。因此,如果有一些详细的信息,将不胜感激。急切地等待着。

在此先感谢兄弟。

+0

只是谷歌的一些样品https://www.google.com/search?q=crawler+with+htmlagilitypack –

回答

5
  1. 使用Webclient您可以登录并下载
  2. 而不是HTML的敏捷性包我喜欢CsQuery因为可以让你使用jQuery的语法在C#代码串里面,这样你就可以下载到一个字符串的HTML和搜索并使用jQuery和HTML页面来处理它。
+0

+1 CsQuery,我不知道它之前:) –

+0

我爱jQuery的。你让它变得非常简单。你能给我留下你的电子邮件吗?我想我在开发应用程序时需要更多的帮助。 – FlatLander

+0

我忘了谢谢你。非常感谢你非常非常...... – FlatLander