我需要将降价文本转换为纯文本格式才能在我的网站上显示摘要。我想在Python中的代码。Python:如何将降价格式文本转换为文本
22
A
回答
36
此模块将帮助你描述一下:
http://www.freewisdom.org/projects/python-markdown/Using_as_a_Module
一旦转换降价到HTML,您可以使用HTML解析器来剔除纯文本。
您的代码可能是这个样子:
from BeautifulSoup import BeautifulSoup
from markdown import markdown
html = markdown(some_html_string)
text = ''.join(BeautifulSoup(html).findAll(text=True))
+1
它似乎像转换为HTML ..我需要转换为纯文本..就像在stackoverflow,在主页问题总结,它删除格式 – Krish 2009-04-17 19:30:10
2
评论,并删除它,因为我终于觉得我看到这里的困难:它可能是更容易的降价文本转换为HTML,并从文本中删除HTML 。我不知道有什么可以有效地从文本中删除降价,但有很多HTML到纯文本解决方案。
相关问题
- 1. 如何将降价(WMD)文本转换为纯文本
- 2. 将降价文本转换为ipython笔记本
- 3. 如何使用Python将文本转换为Json格式
- 4. 如何将文本格式列表转换为python列表
- 5. Django文本格式化,标记?降价?
- 6. 未将文本转换为HTML格式
- 7. VB.Net将文本转换为WWW格式
- 8. 将文本转换为PDU格式
- 9. 将RTF转换为纯文本格式
- 10. JSON - 如何将纯文本格式转换为json格式?
- 11. 使用Python将文本文件转换为JSON格式
- 12. 如何将公式转换为文本?
- 13. 如何将文本文件转换为.arff格式(weka)
- 14. 如何将两列的文本文件转换为fasta格式
- 15. 将文本文件的格式转换为其他格式
- 16. 如何将当前文本替换/转换为所需格式?
- 17. 文档格式转换为文本
- 18. 将文本框中的文本转换为十进制格式
- 19. Python 3:如何将原始格式的unicode文本转换?
- 20. 如何将HTML转换为降价?
- 21. 想要将html转换为python格式的ASCII文本(ansi possible)
- 22. 解决方案将PDF,DOC,DOCX转换为python文本格式
- 23. 将asciidoc转换为降价
- 24. 将文字文本转换为公式
- 25. 通过C#将纯文本格式转换为纯文本格式?
- 26. 如何在tkinter中显示降价格式文本?
- 27. 如何将字符串转换为格式文本C#
- 28. 如何在Excel中将文本转换为日期格式
- 29. 如何将纯文本数据转换为托管格式?
- 30. 如何将纯文本转换为HTML中的html格式
不是python,但是你可以把它传递给pandoc:`pandoc --to = plain`留下一些格式(header undelines),但不是很多。 – naught101 2014-05-29 06:22:00