2017-02-22 21 views
0

因此,有时我需要从网上获取一些数据,将其组织成一个数据框,并浪费大量时间手动完成。我一直在试图弄清楚如何优化这个过程,并且我尝试了一些R的方法,但是无法做到这一点,我认为可以有一个更简单的方法来做到这一点,任何人都可以帮助我出去了吗?无法找出如何处理此练习#R刮#提取网页数据

虚构的锻炼:

这里是由大陆上市国家的网页:https://simple.wikipedia.org/wiki/List_of_countries_by_continents

每个国家的名字也导致其他网页的链接(具体每个国家,例如https://simple.wikipedia.org/wiki/Angola)。

我希望作为最终结果来获得观测值(行)=列出的国家数量和4个变量(colums)作为ID =国家名称,Continent = Continent属于的数据框,Language = Official语言(来自各国的特定网页)和人口=最近的人口数量(来自各国的具体网页)。

为了能够达到最终的数据帧,我应该在R中遵循哪些步骤?

回答