2013-07-06 28 views
0

我必须从网站的HTML表中获取信息。我想要从Node.ja服务器向该网站发出HTML请求并解析HTML表格。除了正则表达式来解析表格单元格中的数据外,是否有JS的库或技术?解析一个HTML结构,有哪些JS工具可用

对不起,我很新的编程。

回答

-1

我会使用JQuery。你可以通过所有的表DATAS迭代像这样:(这会提醒每个表里面的数据的HTML)

$('td').each(function() { alert($(this).html() }); 

或特定表:

$('#specific_table_id.td').each(function() { alert($(this).html() }); 
+0

我的工作使Node.js服务器上的一个伟大的模块,是jQuery的可能吗? – user2535056

+0

有一些在node.js上加载jQuery的方法,但大多数依赖于DOM模拟,并不总是与所有jQuery插件兼容。 –

0
var doc = document.implementation.createDocument(null, your_downloaded_html_page_as_string, null); 

您可以使用正常的DOM功能像getElementByTagName,firstChild,..等,以从您下载的HTML页面获取实际数据。

有关更多方法,请参阅Parse a HTML String with JS

0

jsdom是这个

// Count all of the links from the Node.js build page 
var jsdom = require("jsdom"); 

jsdom.env(
    "http://nodejs.org/dist/", 
    ["http://code.jquery.com/jquery.js"], 
    function (errors, window) { 
    console.log("there have been", window.$("a").length, "nodejs releases!"); 
    } 
);