2014-03-03 168 views
3

我有一个包含嵌入HTML内容的XML文档,我试图将其转换为RTF输出文件。我有用<li>, <p>, <b>和其他HTML标记修饰的XML元素,我想将它们转移到生成的RTF中。将HTML标记转换为RTF文档

这里是什么工作,截至目前:

  1. 获取XML标签内容为字符串(包含换行,段落标记,并列出HTML标签)
  2. 编写XML标签内容到RTF文件。

我正在使用Python脚本来实现转换。另外使用的是ElementTree(解析输入XML)PyRTF-NG(用于将HTML转换为RTF),一个处理表格和其他特殊格式的库。目前,除了HTML的“降价”(即将HTML格式标签转换为实际的RTF格式)之外,我已经成功地获得了我需要的所有内容。为了澄清,我的意思是,如果我的RTF转换器遇到<ol><li>标签,它应该在RTF中创建一个有序列表,而不是将<ol><li>标签分发到RTF中。

有谁知道Python是否有任何本地调用,这将允许我这样做,或任何其他Python库,可能有我需要完成全面转换为RTF。

谢谢!

回答