html-parser

    2热度

    1回答

    我需要一个功能强大的HTML解析器和Objective-C/C的操纵器,比如HTML敏捷包。 谁能告诉我一些最佳的解决方案?一种解决方案是libxml2,但它的接缝不是最好的。 在此先感谢!

    4热度

    1回答

    我知道有一些库用于解析HTML HTMLility包,但无法找到支持表单发布或执行javascript的库。 我想从我的Windows窗体应用程序发布html表单,但不想使用WebBrowser控件或MSHTML库。

    1热度

    2回答

    我在寻找一个基于Java的html解析器,它可以搜索和替换保留html标签的文本。这个问题之前已经在这里问过,但答案似乎没有达到目标。我下载了很少的html解析器,并且编写了简单的程序来查看他们是否可以完成这项工作。这些包括jsoup,Jericho,Java HTML解析器等。这些可以做一个搜索,但是当涉及到替换保留html标签的文本时,没有办法做到这一点。 我已阅读完整牙这些职位: How t

    0热度

    1回答

    我使用org.htmlparser.Parser来解析URL,它适用于网络中的所有内部URL 。但是当我尝试打开外部URL,它给螺纹 异常“主” org.htmlparser.util.ParserException: 连接被拒绝:连接; java.net.ConnectException:连接 被拒绝:连接 这条线出现故障 - 分析器p值=新 分析器( “http://www.google.co

    -1热度

    2回答

    可能重复: if you know xpath then please help? 喜, 所以这里是HTML代码 <html> <body> <table> <tr> Test </tr> <tr> <td> <a href = "google.com"> Google </a> </td> </tr> <tr> <td> test1</td> <td> <a h

    27热度

    4回答

    像PHP中的DOMDocument类,是否有RUBY中的任何类(即核心RUBY),用于从HTML文档中解析和获取节点元素值。

    5热度

    2回答

    我需要html解析,它能够识别生成的html中的错误,并且如果标记未关闭,请关闭它并返回有效的html。 更多详细信息:我从数据库获取数据并打破该记录以显示我的网站上的部分详细信息,以便点击更多按钮,然后显示完整内容。打破字符串然后验证。 我已经使用Html敏捷包,但我是新来使用它,如果这个库解决了我的问题,然后指导我如何(教程)或建议我另一个库。

    7热度

    3回答

    我在乱搞GoogleDocs,它有非常非常原始的CSS支持。如果您上传MSWord .doc或HTML文件并将其导出为HTML,则所有样式均以内联方式应用。他们在html文件中有一个样式块,但是当您将HTML文件上传回google文档时,它不会应用任何非内联样式。 所以我在想“也许这是一个红宝石工具”。有没有什么可以用来获取一些CSS,并将它解析到HTML节点中,也许是一些nokogiri插件?

    0热度

    1回答

    好吧,这就是我正在做的。我正在为以自定义扩展名(.cpm)结尾的文档进行perl解释程序。我环顾四周,发现 http://perlmeme.org/tutorials/html_parser.html https://metacpan.org/pod/HTML::TokeParser::Simple http://www.justskins.com/forums/html-parser-8489.

    1热度

    1回答

    我想使用解析器来确定正文文本内特定H2(或h3/h4/h5/h6)文本发生的位置编号。通过位置编号I表示在此特定h2(或h3/h4/h5/h6)短语之前发生的'单词'数量......另外,如果短语同时出现在h2和h4文本中(例如),则我如何确保我获得这两个文本的正确位置编号?