2017-04-06 67 views
1

我在学习西班牙语和制作一些闪存卡(供我个人使用)来帮助我学习动词。从网站报废数据

下面是一个例子,page example。因此,在页面的顶部,您将看到过去分词:bloqueado & gerund:bloqueando。我希望在我的代码中获得这两个值,并用于我的闪存卡。

如果这是可能的,我将使用c#控制台应用程序。我知道,从网站上删除数据并不理想,但这是一次性的。

任何有关如何开始这样的事情和避免陷阱的指导将非常有帮助!

+0

那么你有什么尝试,以及你卡在哪里?你有没有可能显示的代码? – bassfader

+0

以及我试着看看网页的HTML,看看我是否可以解析它,但我无法看到我在html中所需的字段。因此,否则一直在阅读,以查看其他方式来取消数据,但不使用一些第三方应用程序 – mHelpMe

+1

*你是什么意思,“但是我看不到我在html中所需的字段”*?你指什么领域?使用Chrome开发人员工具查看HTML时,我很容易找到这些值/词,它们都列在以下部分标记中:'

'。对我来说目前还不清楚你到底有什么问题... – bassfader

回答

0

我知道这不是一个确切的答案,但这里是我建议的过程。

  1. https://www.gnu.org/software/wget/并将网站镜像到 文件夹。 Wget是一个网络蜘蛛,并将遵循该网站上的链接,直到它下载了所有内容。您必须使用几个不同的参数运行它,直到找出所需的正确设置。
  2. 使用C#遍历文件夹中的每个文件,并从每个文件中的<section class="verb-mood-section">中提取 单词。您可以选择是将它们输出到控制台还是将它们存储在数据库或平面文件中。

理论上应该那么容易。