2013-11-04 47 views
2

我有几行如: biggestfoolofall,SOOO,hiiieee,footballfan拉长词和词的组合在一个句子蟒蛇

如果您发现上面的图案,无论是有字的组合在1个字本身,如“最大的全部”“足球风扇”。

1)我想知道如何理解它在1个单词内的多词。

2)sooo和hiiieee是拉长的单词。我应该如何检测?

我是新来的python所以被困在这部分。此外,如果你可以分享任何有用的网站学习循环,字符串拆分等,那么这将是非常有帮助

+0

https://wiki.python.org/moin/BeginnersGuide –

+0

你最好使用使用trie的字典。如果写下来的话,单词只是单词。正则表达式对文字毫无所知。 – sln

回答

0

我想你有一个有效的单词列表。所以遍历你的话,检查它们是否在您的线路:

for word in words:        # iterate over all valid words 
    if word in line:       # if a valid word is found in line 
     print 'I found a valid word: '+word 
     line.replace(word,'')     # remove the word from your line 

最后,你最终找到留在你的“线”变量的所有有效的话,只有垃圾字符。

有关更多字符串操作,请参见string methods

+0

由于重叠的情况会比这更多地涉及 - 例如,在'傻瓜'中'落'。 –