如何在python（unicode类型）中逐行处理文本段落？

-2

我有一个变量（类型为unicode），其中包含一些文本。我从另一个类型为'bs4.element.Tag'的类型的变量（美丽的汤）取得了这段文字。在这种可变文本的如何在python（unicode类型）中逐行处理文本段落？

例子是：

1234单词

1234 words1 words2

我试图做的是通过操纵该行文本行，所以我修剪的每一行分为两部分：一部分包含前四个字符，即1234，另一部分仅包含文本。

问候

2013-03-12 Honesta

http://docs.python.org/2/library/stdtypes.html – 2013-03-12 08:35:01

@FallenAngel我已经把它在里面<>和计算器删除它。 – Honesta 2013-03-12 08:48:43

@ZagorulkinDmitry为什么不给我www.google.com。我尝试了第一次搜索，但找不到任何东西，这就是为什么我要问一个问题。 Jeez，我们是什么社区。 – Honesta 2013-03-12 08:50:23

您可能正在寻找类似方法“分裂（）”或“分裂线（）”（根据您的变量）。

这将是这样的：

var.split() # if you want to split using the space 
    # or 
    var[:4] # if you are sure that you need the first 4 characters.

2013-03-12 08:49:50

我已经试过这些方法，但没有工作，因为我的变量包含多行，我想修剪每一行。我也尝试了splitline（），但显示属性错误：AttributeError：'unicode'对象没有属性'splitline' – Honesta 2013-03-12 08:56:06

回答