2013-03-12 35 views
-2

我有一个变量(类型为unicode),其中包含一些文本。我从另一个类型为'bs4.element.Tag'的类型的变量(美丽的汤)取得了这段文字。在这种可变文本的如何在python(unicode类型)中逐行处理文本段落?

例子是:

1234单词

1234 words1 words2

我试图做的是通过操纵该行文本行,所以我修剪的每一行分为两部分:一部分包含前四个字符,即1234,另一部分仅包含文本。

问候

+0

http://docs.python.org/2/library/stdtypes.html – 2013-03-12 08:35:01

+0

@FallenAngel我已经把它在里面<>和计算器删除它。 – Honesta 2013-03-12 08:48:43

+0

@ZagorulkinDmitry为什么不给我www.google.com。我尝试了第一次搜索,但找不到任何东西,这就是为什么我要问一个问题。 Jeez,我们是什么社区。 – Honesta 2013-03-12 08:50:23

回答

0

您可能正在寻找类似方法“分裂()”或“分裂线()”(根据您的变量)。

这将是这样的:

var.split() # if you want to split using the space 
    # or 
    var[:4] # if you are sure that you need the first 4 characters. 
+0

我已经试过这些方法,但没有工作,因为我的变量包含多行,我想修剪每一行。我也尝试了splitline(),但显示属性错误:AttributeError:'unicode'对象没有属性'splitline' – Honesta 2013-03-12 08:56:06