我有几行如: biggestfoolofall,SOOO,hiiieee,footballfan拉长词和词的组合在一个句子蟒蛇
如果您发现上面的图案,无论是有字的组合在1个字本身,如“最大的全部”“足球风扇”。
1)我想知道如何理解它在1个单词内的多词。
2)sooo和hiiieee是拉长的单词。我应该如何检测?
我是新来的python所以被困在这部分。此外,如果你可以分享任何有用的网站学习循环,字符串拆分等,那么这将是非常有帮助
我有几行如: biggestfoolofall,SOOO,hiiieee,footballfan拉长词和词的组合在一个句子蟒蛇
如果您发现上面的图案,无论是有字的组合在1个字本身,如“最大的全部”“足球风扇”。
1)我想知道如何理解它在1个单词内的多词。
2)sooo和hiiieee是拉长的单词。我应该如何检测?
我是新来的python所以被困在这部分。此外,如果你可以分享任何有用的网站学习循环,字符串拆分等,那么这将是非常有帮助
我想你有一个有效的单词列表。所以遍历你的话,检查它们是否在您的线路:
for word in words: # iterate over all valid words
if word in line: # if a valid word is found in line
print 'I found a valid word: '+word
line.replace(word,'') # remove the word from your line
最后,你最终找到留在你的“线”变量的所有有效的话,只有垃圾字符。
有关更多字符串操作,请参见string methods。
由于重叠的情况会比这更多地涉及 - 例如,在'傻瓜'中'落'。 –
https://wiki.python.org/moin/BeginnersGuide –
你最好使用使用trie的字典。如果写下来的话,单词只是单词。正则表达式对文字毫无所知。 – sln