0
我试着使用Xerces DOM文档C++解析器加载HTML和搜索特定的HTML元素。我无法找到关于如何完成此操作的很好示例。我似乎找到的所有解析XML。有人可以协助吗?谢谢。C++ Xerces解析器加载HTML和搜索HTML元素
我试着使用Xerces DOM文档C++解析器加载HTML和搜索特定的HTML元素。我无法找到关于如何完成此操作的很好示例。我似乎找到的所有解析XML。有人可以协助吗?谢谢。C++ Xerces解析器加载HTML和搜索HTML元素
看看这个:http://xerces.apache.org/xerces-c/program-dom-3.html
没有与DOM文档的例子还有:
// //创建一个小文档树 //
{
XMLCh tempStr[100];
XMLString::transcode("Range", tempStr, 99);
DOMImplementation* impl = DOMImplementationRegistry::getDOMImplementation(tempStr, 0);
XMLString::transcode("root", tempStr, 99);
DOMDocument* doc = impl->createDocument(0, tempStr, 0);
DOMElement* root = doc->getDocumentElement();
XMLString::transcode("FirstElement", tempStr, 99);
DOMElement* e1 = doc->createElement(tempStr);
root->appendChild(e1);
XMLString::transcode("SecondElement", tempStr, 99);
DOMElement* e2 = doc->createElement(tempStr);
root->appendChild(e2);
XMLString::transcode("aTextNode", tempStr, 99);
DOMText* textNode = doc->createTextNode(tempStr);
e1->appendChild(textNode);
// optionally, call release() to release the resource associated with the range after done
DOMRange* range = doc->createRange();
range->release();
// removedElement is an orphaned node, optionally call release() to release associated resource
DOMElement* removedElement = root->removeChild(e2);
removedElement->release();
// no need to release this returned object which is owned by implementation
XMLString::transcode("*", tempStr, 99);
DOMNodeList* nodeList = doc->getElementsByTagName(tempStr);
// done with the document, must call release() to release the entire document resources
doc->release();
};
..等等。
编辑:
但我怎么加载HTML到DOMDocument和搜索对html元素?这是什么林试图弄清楚。
XercesDOMParser解析器;
parser.loadGrammar( “grammar.dtd”,语法:: DTDGrammarType);
parser.setValidationScheme(XercesDOMParser :: Val_Always);
处理程序处理程序;
parser.setErrorHandler(&处理程序);
parser.parse( “xmlfile.xml”);
但是,如何将HTML加载到DOMDocument中并针对html元素进行搜索?那就是我试图弄清楚的。 – jkushner