我有一个网页,其中包含content for 260 news articles。我需要单独的HTML文件中的每篇文章。而不是复制和粘贴每个这些内容块(我已经预先使用jQuery格式进行复制/粘贴 - 它最初是一个XML文件)手动到新文件中,是否有一种方法可以自动执行此操作?请有人告诉我有一种方法。将HTML文档自动分割为许多HTML文档
0
A
回答
0
应该是你可以用任何脚本语言轻松烹饪的东西。看起来每篇新文章都以“--- \ nTitle”开头。所以,只需要逐行读取源文件,每当遇到“--- \ nTitle”时打开一个新的输出文件,并将这些行写入当前输出文件。
0
好吧,如果它开始为XML,那么你可以很容易使用XSLT 2.0拆呢:
<xsl:template match="article">
<xsl:result-document href="article{position()}.xml">
<xsl:copy-of select="."/>
</xsl:result-document>
</xsl:template>
在匹配模式是什么特点,标志着你的文章边界的元素。更好的做法是使用XML结构将其转换为纯文本,然后对其进行处理。
相关问题
- 1. 使用BeautifulSoup分割HTML文档
- 2. 如何使用Nokogiri分割HTML文档?
- 3. HTML文档,第2部分
- 4. 从HTML文档
- 5. HTML文档
- 6. HTML文档
- 7. xsltproc html文档
- 8. 力自动完成对全HTML文档
- 9. html文档之间的多向滚动
- 10. 将HTML文档读入R
- 11. 将文本文件拆分为HTML文档
- 12. HTML分页为可编辑文档
- 13. 如何将动态生成的HTML文档嵌入到HTML文档中?
- 14. 将文档从html文档输出为php格式
- 15. 文档显示为HTML
- 16. 定期为HTML文档
- 17. HTML:如何启动HTML文档标题
- 18. 将网页html下载到html文档
- 19. NetOffice-将word文档读取为HTML
- 20. 将表单保存为html文档
- 21. 将HTML标记转换为RTF文档
- 22. 将HTML转换为Word文档
- 23. 如何将HTML转换为PDF文档
- 24. 如何将Markdown文档转换为HTML?
- 25. 将HTML转换为Google文档转换
- 26. 将Google文档设置为HTML
- 27. 。将HTML转换为word文档
- 28. 将大型HTML文档转换为PDF
- 29. 快速将Word文档转换为HTML
- 30. 将文档转换为html格式
您需要查看文件对象 – mplungjan