您的目标是提示用户输入文本文件进行分析。您还将提供 带有停用词的文件 - 当您分析文件时将被忽略的词。创建一致性后,打印 示例中指示的一致性结果。对于在和谐的每个字,你将打印:与Python的协调
- 字
- 出现
- 每次出现的总次数:
- 文件中的行号(第一行是行# 1)
- 本地上下文。本地上下文是具有全部大写字母的指定单词的原始行。
这是我到目前为止有:
import string
file_str = raw_input("What file to analyze:")
file_obj = open(file_str)
for line in file_obj.readlines():
line = line.strip()
split_line = line.split()
for word in split_line:
word = word.lower()
word = word.strip(string.punctuation)
我不知道从哪里里去!
最近几天在SO上也有类似的问题。你可能想浏览一下档案。 –
你有一个语法问题:缩进第四行下面的所有代码。你如何定义一致性? – Simon
你试图做什么,你卡住了? – millimoose