我不会告诉你所有的细节,你必须自己找到它们。有些网页很复杂,有些很容易。其他是不可能的,特别是如果文本不是以HTML格式显示,而是以其他形式显示 - 图片,Flash等。
但是,在Excel中从HTML网页提取数据非常简单。首先,你想自动化它。因此点击'开发人员'功能区上的'录制宏'。这样,您将记录所有可重复的步骤,然后您可以查看宏,并根据需要调整某些步骤。然而,我不能在这里教你如何编程VBA。
当您录制宏时,点击'数据'功能区上的'从网络'。这将显示一个新的网络查询。然后输入您想要阅读的网页地址,然后尝试选择(尽量使用小箭头或注销标记)作为您感兴趣的狭窄区域。您也可以在此向导对话框中浏览一些微调选项。
完成后,单击“导入”,您将以某种形式显示网页的内容。如果你幸运的话,你感兴趣的数据将永远在同一个单元格中。然后,您可以读取单元格并将值存储在某处(可能使用另一个宏)。如果每次刷新查询时数据不在同一个单元格中,那么运气不好,必须使用一些复杂的公式或宏来查找它们。
下一步停止正在记录的宏,并查看记录的代码。试着去尝试一下,直到你发现你真正需要的东西。那么它取决于你,你想如何自动化它。选项很多...
否则Excel可能不是最好的工具。如果我想加载HTML页面并从中提取数据,我会使用一些脚本例如Python比Excel和VBA具有更好的工具。还有一些工具可以将HTML转换为XHTML,然后从格式良好的XML中提取数据。