2013-05-20 138 views
-3

我有一个word文档。当我上传该文档时,我需要从中获取该名称。我总是有名字的第一行中的数据在Word文档一样,获取html标签之间的数据

Shanish K 
[email protected] 
..... 
...... 

对于这一点,我只是转换Word文件为HTML,并从想读的名字。一旦我将word文件转换为style defenitions以及实际内容。我不知道如何获取first row中的数据。有人可以帮我从这里出去吗。在此先感谢...

注意: - 我注意到一些事情,当我调试时,实际内容是在段落标签之间<p .....>Shanish</p> .....,是可能的取数据之间的第一个<p></p>

+1

你为什么要这么做?我想有比将Word文档转换为HTML更好的方法。 –

+0

@ RichardMarskell-Drackir可以请你给一些想法做到这一点? – shanish

+1

我可以,如果我知道*为什么*你试图做到这一点。你的最终目标是什么? –

回答

3

是的,你可以使用HTMLAgilityPackFizzlerExCSQuery

我会用FizzlerEx。加载文档并选择第一个匹配的p元素。

using HtmlAgilityPack; 
using Fizzler.Systems.HtmlAgilityPack; 

var web = new HtmlWeb(); 
var document = web.Load("http://example.com/page.html") 
var page = document.DocumentNode; 

var name = page.QuerySelector("p:eq(0)"); 
+0

感谢你的回应,我会尝试这一点,让你知道... – shanish