我的情况很糟糕。我需要编程一些东西,这是我的能力水平。文本文件概率计算(马尔可夫链) - Python
我已经给出了一个10k字的文本,该文件被称为(test_file.txt)。 我给你们的问题是: 如何让我的程序计算每一个单词和每一个字母,以便我可以计算单词的概率,查看哪个单词和字母代表最多。
我知道它的东西用绳子,我都在这一刻所做的是:
import codecs
import sys
import random
fh = codecs.open("test_file.txt", encoding="utf-8")
fh.close()
omega = {'a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z','A','B','C','D','E','F','G','H','I','J','K','L','M','N','O','P','Q','R','S','T','U','V','W','X','Y','Z'}
def Markov(text_file):
with open("test_file.txt") as t:
text = t.read()
text = [' '.join(data.split(' ')) if i !='']
text = [i.lower() for i in data if i.isalpha()]
chains = {i:[] for i in data}
这是正确的?
我需要你的帮助家伙。
当你用一个20个字的小文件测试它时,它是做你想做的吗? – Gerrat
我什至不知道,如何用小文件测试它,这就是问题所在。 希望你能帮助我。 – Borgmester
你打电话做一些让你头脑发热的事情“不好的情况”。我会称之为“学习”。 – jme