我尝试提取页面的所有文本内容(因为它不与Simpledomparser工作)使用PhantomJS提取HTML和文本
我尝试修改从手动
var page = require('webpage').create();
console.log('The default user agent is ' + page.settings.userAgent);
page.settings.userAgent = 'SpecialAgent';
page.open('http://www.httpuseragent.org', function (status) {
if (status !== 'success') {
console.log('Unable to access network');
} else {
var ua = page.evaluate(function() {
return document.getElementById('myagent').textContent;
});
console.log(ua);
}
phantom.exit();
});
这个简单的例子
我试图改变
return document.getElementById('myagent').textContent;
到
return document.textContent;
这不起作用。
什么是做这个简单的事情的正确方法?
您好我尝试,但但它resturns NULL –