2011-06-25 47 views
1

我在单个HTML文档中有超过50页的篇幅很长的文章。我想知道是否有算法可以将HTML文档按页面(A4大小的页面)(如打印预览功能)拆分为每个页面的较小文件,同时保持正确的格式。按页面拆分大型HTML文档

我使用.NET 4.0 C#

回答

0

这并不总是工作,但有时你可以打印的文档为PDF,拆分PDF成每页一个PDF,并转换这些PDF到HTML文件。但结果并不总是很好。

0

您可以使用HTMLDOC分裂成HTML页面:

Here's a blogpost explaining the process

+0

它看起来像是通过标题拆分它,而不是通过将被打印的页面。 – icktoofay

+0

不仅如此,HTMLDOC的链接似乎指向HTML操作软件以外的其他东西。更像是一个帮助你的论文网站。 –

0

您是否尝试过使用虚拟打印机,如CutePDF和打印文档为PDF?另外,根据我链接的网站,CutePDF有它自己的SDK。

+0

输出必须是html。 – Alice

0

目前尚不清楚您为什么要这样做,但只需在Microsoft Word中打开您的页面即可。 Microsoft Word具有“打印布局”,您可以在其中逐页查看文档。最终你将能够编辑它,使其适合。