1
我正在尝试编写一个解析器,将采取HTML和转换/输出到Wiki语法(<b>
= '''
,<i>
== ''
等)。BeautifulSoup replace_with非标准标签
到目前为止,BeautifulSoup似乎只能替换标签内的内容,因此<b>
变为<'''>
而不是'''
。我可以使用re.sub()将它们交换出来,但是由于BS将文档转换为“Python对象的复杂树”,我无法弄清楚如何替换这些标签并将它们重新插入到整体中文件。
有没有人有想法?
神奇。这就是我需要的,谢谢。有些工具可以在不同程度上执行此功能,但我可以找到的每个工具都保留了过多的HTML。我希望在可能的情况下纯转换为Wiki标记。 –