哪种方法可以最好地保存使用casperjs拆分网页时获取的表数据?使用casperjs保存拆分网页时获取的表数据
使用json对象并在序列化后将其存储为文件。
使用ajax请求到PHP,然后将其存储在MySQL数据库。
哪种方法可以最好地保存使用casperjs拆分网页时获取的表数据?使用casperjs保存拆分网页时获取的表数据
使用json对象并在序列化后将其存储为文件。
使用ajax请求到PHP,然后将其存储在MySQL数据库。
为了简单起见,查看CasperJS作为一种方法来获取数据&在另一种语言后处理。我会选择#1选项 - 以JSON格式获取数据,并将其保存到文件中以便稍后执行。
要做到这一点,您可以使用PhantomJS提供的File System API。您也可以将它与CasperJS's cli interface耦合以允许您将参数传递到脚本中(例如,要写入的临时文件)。
你的脚本来处理这一切看起来像:
mktemp
)临时文件的路径。我只是用第二种情况:
第一:获得存储在globalInfo变量的信息
var globalInfo;
casper.thenOpen("www.targetpage.cl/valuableInfo", function() {
globalInfo = this.evaluate(function(){
var domInfo = {};
domInfo.title = "this is the info";
domInfo.body = "scrap in the dom for info";
return domInfo;
});
});
二:访问的网页存储所捕获的数据
casper.then(function(){
casper.thenOpen("www.mipage.com/saveIntheDBonPost.php", {
method: 'post',
data:{
'title': ''+globalInfo.title,
'body': ''+globalInfo.body
}
});
});
www.mipage.com/saveIntheDBonPost.php
取参数$_POST
中的数据并将其存储到数据库。