我一直在使用这个网站很长一段时间来找到我的问题的答案,但我无法找到答案在这一个。从网页中提取数据,解析它的特定部分,并显示它
我正在与一个班级项目上的小组合作。我们要建立一个小型的“游戏交易”网站,允许人们注册,投入他们想要交易的游戏,并接受其他人的交易或请求交易。
我们的网站运行时间提前很多,所以我们试图增加更多的网站。我想要做的一件事就是把放入Metacritic的游戏链接起来。
这是我需要做的。我需要(在Visual Studio 2012中使用asp和c#)在metacritic上获取正确的游戏页面,抽取其数据,解析特定部分,然后在页面上显示数据。
基本上,当你选择一个你想交易的游戏时,我们需要一个小的div来显示游戏的信息和评分。我想通过这种方式来学习更多东西,并从这个项目中获得一些东西,我不必从头开始。
我想知道是否有人能告诉我从哪里开始。我不知道如何从网页中提取数据。我仍然试图弄清楚是否需要尝试写一些东西来自动搜索游戏的标题并以这种方式找到页面,或者如果我能找到某种方式直接进入游戏页面。一旦我获得了数据,我不知道如何从中获得所需的具体信息。
其中一件事情并没有使这个简单的事情是,我正在学习C++以及c#和asp,所以我不断让我的电线穿过。如果有人能指引我正确的方向,这将是一个很大的帮助。谢谢
谷歌,HTML敏捷性包和提琴手 – ryan
你要找的期限为屏幕抓取或[网页抓取(http://en.wikipedia.org/wiki/Web_scraping)。 – Greg