0
我想创建一个API将PDF文件转换为JSON。我在解析pdf文件后得到的数据是用逗号分隔的值。我正在使用Nodejs pdf2json软件包。 数据什么我米解析PDF文件后得到:如何使用JavaScript将解析数据写入JSON文件?
"val a: 1, val b: 2, val c, vald: 3, 4, 5, 6, val e: 7,"
所需的输出:
{
"val a" : 1,
"val b" : 2,
"val c" : "",
"vald" : "3,4,5,6",
"val e": 7
}
我使用的代码:
var express = require('express'),
app = express(),
upload = require('express-fileupload'),
http = require('http').Server(app).listen(8080),
PDFParser = require("pdf2json"),
fs = require('fs');
console.log("Server started on port 8080");
//pdf parser
let pdfParser = new PDFParser(this, 1);
//express file uploader
app.use(upload());
app.get("/", (req, res) => {
res.sendFile(__dirname + "/index.html");
})
app.post("/", (req, res) => {
if (req.files) {
var file = req.files.filename,
filename = file.name;
pdfParser.parseBuffer(file.data);
pdfParser.on("pdfParser_dataError", errData => console.error(errData.parserError));
pdfParser.on("pdfParser_dataReady", pdfData => {
var output = JSON.stringify(pdfParser.getRawTextContent()).split(/\\r\\n/);
fs.writeFile('data2toJson.json', output, 'utf8');
console.log("hellow" + Date());
});
res.send("done");
}
})
<form method="post" enctype="multipart/form-data" action="/">
<input type="file" name="filename">
<input type="submit" value="upload">
</form>
你有什么发现?上述代码的结果是什么? – tgdn
我在问题 – Vino
中给出了上述代码的结果。对不起,我的太快读了 – tgdn