我有兴趣编写一个脚本,最好是一个容易添加到使用诸如Greasemonkey等工具的浏览器,它将页面的HTML源代码发送到外部服务器,稍后它将在其中分析和有用的数据将被发送到数据库。发送源代码到外部服务器
但是,我还没有看到这样的事情,我不知道如何处理这个任务。我会想象某种HTTP post是最好的方法,但我对这些想法完全陌生,而且我甚至不会在哪里发送数据来解析它(发送整个数据是没有意义的例如HTML文档到数据库)。因此基本上,我的总体目标是这样工作的(请注意,我只需要步骤1和2的帮助。我熟悉数据解析技术,我从来没有将它们应用到网络上):
- 用户查看特定网页
- 源代码经由Greasemonkey的或一些其它工具发送到该代码被解析成有意义的数据的服务器
- 存储在MySQL数据库。
任何提示或帮助非常感谢,谢谢!
编辑:代码
ihtml = document.body.innerHTML;
GM_xmlhttpRequest({
method:'POST',
url:'http://www.myURL.com/getData.php',
data:"SomeData=" + escape(ihtml)
});
编辑:当前JS日志:
Namespace/GMScriptName: Server Response: 200
OK
4
Date: Sun, 19 Dec 2010 02:41:55 GMT
Server: Apache/1.3.42 (Unix) mod_gzip/1.3.26.1a mod_auth_passthrough/1.8 mod_log_bytes/1.2 mod_bwlimited/1.4 FrontPage/5.0.2.2635 mod_ssl/2.8.31 OpenSSL/0.9.8e-fips-rhel5 PHP-CGI/0.9
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html
Array
(
)
http://www.url.com/getData.php
这听起来像的东西,将用于广告或类似的行为定位 - 要知道,有问题的网页源代码可能包含敏感信息(电子邮件,银行记录等)就个人而言,我会完全避免这种情况,但如果您坚持这样做,请确保您的代码非常安全。 – Basic 2010-12-18 00:00:24