我有一个网站,将特别阅读PHP与XML样式文件并显示一些内容。更新网站的人并不那么专注,所以我希望能够创建一个程序,将一个Powerpoint转化为我所需要的XML类型。C#与HTML标签
我转换PowerPoint - > RTF - > HTML。示例输出如下:
<p style="text-align:center;"><span style="background-color:#FFFFFF;font-family:Calibri font-size:44pt;">Title 1</span></p>
<p><span style="background-color:#FFFFFF;font-family:Calibri;font-size:32pt;">Data in here.</span></p>
<p> </p>
<p><span style="background-color:#FFFFFF;font-family:Calibri;font-size:32pt;">More Data.</span></p>
<p> </p>
我希望逐行阅读HTMl,解释标签并创建我自己的文件。
即时通讯:每个具有特定标签的标签将被归类为标题,然后任何具有另一个特定标签的标签将被归类为数据。
例Ouptut:
<FILE>
<ITEM>
<TITLE>Title 1</TITLE>
<DATA><p>Data in here</p><p> </p><p>More Data.</p></DATA>
</ITEM>
</FILE>
(如何)才能做到这一点?
注:我不是在寻找如何删除所有标签:Like here和and here
注2:在PowerPoint没有一个固定的字体/字体大小。如果可能的话,我希望它完全独立。如果这不起作用,是否可以在PowerPoint中使用固定模板来完成,因此每个标题和数据部分都是相同的,因此具有相同的标签?
您可以使用'HtmlAgilityPack'来解析HTML。 –