2015-03-31 169 views
1

我想使用HtmlAgilityPack获取html标记之间的文本,我知道它的基本类型,但我需要检查并完全理解库的工作原理。获取html标记之间的内容

这里是简单的代码:

{ 
class Program 
{ 
    static void Main(string[] args) 
    { 
     HtmlWeb htmlWeb = new HtmlWeb(); 
     HtmlDocument htmlDocument = htmlWeb.Load("http://192.168.1.177/"); 
     Console.WriteLine();// write the html 
     Console.ReadLine(); 
    } 
} 

}

这是我的网页内容从远程传感器来:

enter image description here

我希望我的输出是:

模拟量输入0是213
模拟输入端1 201
模拟输入2是206
模拟输入3为214
模拟输入4为223
模拟输入5为240

而不html和/ html标签

回答

1
htmlDocument.DocumentNode.InnerText 
  • DocumentNode代表HTML文档的根节点
  • InnerText包含当前HtmlNode内的所有文本节点,级联(注意DocumentNode属性的类型为HtmlNode)。
+0

谢谢@ har07 我不能摆脱<!DOCTYPE HTML>?使用HtmlAgilityPack 或我应该只使用普通的exp或任何其他方法? – 2015-03-31 05:51:36

+1

@SabirMoglad一种可能的方式:'doc.DocumentNode.SelectSingleNode(“html”)。InnerText.Trim()' – har07 2015-03-31 05:55:36

+1

'Trim()'只是为了去除'不必要的'前导和尾随空白 – har07 2015-03-31 05:56:21