此函数接受一个字符串文本,并返回一个包含字符串列表的列表,其中包含字符串文本中每个句子的一个列表。在Python中,如何获取字符串文本,并返回一个包含字符串列表的列表?
句子被字符串“。”,“?”或“!”之一分隔。我们忽略了其他标点符号分隔句子的可能性。所以'Mr.X'会变成2个句子,'不'会变成2个单词。
例如,文本是
Hello, Jack. How is it going? Not bad; pretty good, actually... Very very
good, in fact.
,函数返回:
['hello', 'jack'], ['how', 'is', 'it', 'going'], ['not', 'bad', 'pretty', 'good', 'actually'], ['very', 'very', 'good', 'in', 'fact']]
最令人困惑的部分是如何使功能检测字符。 ! ?以及如何使它成为一个列表的列表包含每个句子中的单词。 谢谢。
're.split( “[。?!]”,all_text)'应该得到你的第一部分,'re.findall(“[a-zA-Z] +”,some_text)'会让你在文本块中的所有字母单词(仅字母) – 2014-11-06 15:41:27