2013-05-11 23 views
0

好吧,所以我在python中编写了一个函数,它需要一个带有===,==,---,#text等标记的文本文档。等等(很像维基百科)。现在我的程序基本上必须用HTML标记代替它们,例如&-ndash,& mdash,<> text等,以便它们可以在浏览器中正确显示。这是我到目前为止:将纯文本标记更改为HTML标记以显示在浏览器中python

​​

我在正确的轨道上?或者还有什么我需要包括?我是相当新的这个

+1

您确定要实施“另一个标记格式”?如果你使用一个已经建立的(例如[restructured text])(http://docutils.sourceforge.net/docs/ref/rst/restructuredtext.html),你可以使用现有的工具来格式化它。 – 2013-05-11 13:22:16

+0

我不介意哪种方式我只要不需要导入一个新的模块,如果我使用重构的文本,我应该去哪个方向? – user2368457 2013-05-11 13:32:02

+0

您可以详细说明您尝试实现的目标吗?将其作为学习体验实施,构建文档工具,博客平台? – 2013-05-11 13:34:07

回答

0

你最好的选择(如果你想编写自己的功能,并避免使用现有的工具)是使用正则表达式,这是很简单的

import re 

def subst(text): 
    str = '#text#' 
    capture = re.search('#(.+)#', str) 
    return '<li>'+ capture.group(1)+ '</li>' 

我希望你能想法 你也可以使用'==(。+)=='等模式来捕捉你想要的东西。 您可以查看这篇文章以了解更多有关使用re.search和re.match https://stackoverflow.com/a/180993/2152321

您还可以了解更多关于正则表达式模式构建这里 http://www.tutorialspoint.com/python/python_reg_expressions.htm