我对如何使用承诺略有困惑。我已经阅读了一些关于承诺的内容,主要是因为它好像我必须使用它们。我正在研究一个小应用程序,它应该使用pdfjs搜索一些pdf文件,并使用promise。通过查看网络上的各种示例,我在nodejs中敲了一些东西,但遇到了一个问题。javascript的承诺,在这里需要吗?
让我们看一下代码第一:
require('pdfjs-dist');
var fs = require('fs');
//var searchTerm = "course";
var searchTerm = "designee";
//var searchTerm = "document";
var wordCounter = 0;
var searchResultJSON = [];
//var data = new Uint8Array(fs.readFileSync('testPdf.pdf'));
//var data = new Uint8Array(fs.readFileSync('advanced-javascript.pdf'));
var data = new Uint8Array(fs.readFileSync('iss4.pdf'));
PDFJS.getDocument(data).then(function (pdfDocument) {
console.log('Number of pages: ' + pdfDocument.numPages);
//var div = document.getElementById('viewer');
for(var i = 1; i<=pdfDocument.numPages; i++){//loops thru pages
console.log("i is " + (i));
pdfDocument.getPage((i)).then(function(page){//get page(i),
// console.log("page is " + (i));
//console.log("inside getPage()");
page.getTextContent().then(function(textContent){//get content of pdf
//console.log("inside getTextContent()");
//if(null != textContent.items){
var page_text = "";
var last_block = null;
var lineWithResult = "";
for(var k = 0; k < textContent.items.length; k++){
var block = textContent.items[k];
//console.log("word " + textContent.items.length + " k is " + k);
/* if(last_block != null && last_block.str[last_block.str.length-1] != ' '){
if(block.x < last_block.x)
page_text += "\r\n";
else if (last_block.y != block.y && (last_block.str.match(/^(\s?[a-zA-Z])$|^(.+\s[a-zA-Z])$/) == null))
page_text += ' ';
} */
page_text += block.str;
last_block = block;
lineWithResult = searchPdf(block.str);
if(lineWithResult != null){
console.log(lineWithResult + " wordCounter is " + wordCounter);
}
}//end of for(var k...)
//console.log(" page_text " + page_text);
//console.log(searchResultJSON);
//}
});//end of textContent.items
});//end of getPage
}//end of loop
});
function searchPdf(toSearch){//searching pdf for searchTerm
var result = toSearch.toLowerCase().indexOf(searchTerm);
if(result >=0){//if match is found
wordCounter++;
//console.log("toSearch " + toSearch + " result is " + result + " wordCounter " + wordCounter);
constructResult(toSearch, result);//build the result object
return toSearch;
}
else{//if match not found
return null;
}
}
function constructResult(toSearch, result){//construct array of objects containing: search term, search result and index of search term
searchResultJSON.push({
"TextLine":toSearch,
"SearchTerm":searchTerm,
"Result": result,
});
}
这段代码的目的是:
遍历PDF格式的网页
遍历内容
以可变的方式逐行获取pdf文本
搜索PDF内容与关键字
如果关键字找到匹配,打印匹配
获得比赛的JavaScript物件
所以,这一切工作好,但你会注意到,从第二个for循环(我得到的文本是pdf的文本)我调用一个函数,searchPdf()
基本上执行搜索,并从该函数内调用另一个函数这应该是创建JavaScript对象与结果的constructResult(...)
。
虽然我在打印这个对象时遇到了一些问题,因为如果我将它打印在for循环的范围之外,它是空的,因为打印调用(在我的情况下是console.log)在循环实际复制之前执行,分析(读取过程并找到匹配)的文本。所以,承诺看到了解决问题的方法。事情是,我不知道如何编码这种方式,以便我可以链接承诺并在执行完所有内容后打印我的对象。任何想法?
编辑: 所以要澄清,我需要的顺序是这样的: 1)通过PDF环路(我将不得不通过PDF文件的集合在某一点很快修改代码回路) 2)得到各文字 3)的线检查有匹配 4)如果是这样,复制文本的行JavaScript对象 5)打印的JavaScript对象
可能[用promise替换回调的副本在Node.js](http://stackoverflow.com/questions/28432401/replacing-callbacks-with-promises-in-node-js) –
你可以创建一个打印函数,从循环内部调用并返回结果到循环外的变量 –
@DexDave,已经尝试过了,它不起作用,因为变量将是空的,我需要首先执行所有操作,然后将结果返回给该变量 – antobbo