2012-09-18 129 views
-1

我正在尝试创建一个网页,用于复制从其他网页获得的某些文本,但我不知道如何执行此操作。从网页中提取文本信息

举一个例子: http网站A上有一个数字,用户加载页面时某一特定位置的风速。我确切知道它会在页面上的哪个位置,就像它始终是页面上的第三个数字,或者它将以wind speed:或其他内容开头,我有一个正式的表达或者我知道的东西会给我我想从页面上得到的东西,并且我有网页所有者的许可来使用他们的信息或任何东西。我希望能够从该页面获取该号码,并将其放在我自己的网页上。

有没有什么方法可以只使用HTML来做到这一点?或者我需要使用其他的东西来获取信息,比如javascript?

+0

尝试使用谷歌搜索“屏幕抓取”。 –

回答

0

通常向其他网站提供信息的页面使用Web服务来提供信息。

这样,这样的页面将有一个选定的网址的方法,您可以访问以获取信息。

根据实现的方式,您可以直接在HTML页面中加载Web服务的响应。但是,建议使用AJAX调用Web服务并操作响应。

当然,如果没有可用的网络服务,并且您将从纯HTML文本中去除信息,那么您将需要明确的JavaScript来完成这项任务,没有办法通过HTML来完成。

0

由于巴尔多说你有2个选择。第一个是Web服务,第二个是使用JavaScript解析页面,或者简单地尝试找到想要提取的信息的位置,您可以搜索页面中的特定模式并提取信息。