我必须从网站的HTML表中获取信息。我想要从Node.ja服务器向该网站发出HTML请求并解析HTML表格。除了正则表达式来解析表格单元格中的数据外,是否有JS的库或技术?解析一个HTML结构,有哪些JS工具可用
对不起,我很新的编程。
我必须从网站的HTML表中获取信息。我想要从Node.ja服务器向该网站发出HTML请求并解析HTML表格。除了正则表达式来解析表格单元格中的数据外,是否有JS的库或技术?解析一个HTML结构,有哪些JS工具可用
对不起,我很新的编程。
我会使用JQuery。你可以通过所有的表DATAS迭代像这样:(这会提醒每个表里面的数据的HTML)
$('td').each(function() { alert($(this).html() });
或特定表:
$('#specific_table_id.td').each(function() { alert($(this).html() });
var doc = document.implementation.createDocument(null, your_downloaded_html_page_as_string, null);
您可以使用正常的DOM功能像getElementByTagName,firstChild,..等,以从您下载的HTML页面获取实际数据。
有关更多方法,请参阅Parse a HTML String with JS。
jsdom是这个
// Count all of the links from the Node.js build page
var jsdom = require("jsdom");
jsdom.env(
"http://nodejs.org/dist/",
["http://code.jquery.com/jquery.js"],
function (errors, window) {
console.log("there have been", window.$("a").length, "nodejs releases!");
}
);
我的工作使Node.js服务器上的一个伟大的模块,是jQuery的可能吗? – user2535056
有一些在node.js上加载jQuery的方法,但大多数依赖于DOM模拟,并不总是与所有jQuery插件兼容。 –