我正在研究一个系统,可以根据各种用户输入(如音节模板或修改的Backus Naur表单)创建构成fanatsy的单词。然而,一种新模式计划为机器学习。在这里,用户没有明确定义任何规则,而是粘贴一些文本,系统学习给定单词的结构并创建相似的单词。机器学习的单词结构
我现在幼稚的做法是创建信邻里概率表(包括特殊结束字“字母”),并通过字母对扫描输入(使用空格和标点符号作为单词加油吧边界)。创建一个词将意味着查找每个字母的概率以跟随当前字母,并根据概率随机选择一个,并重复,直到遇到字末尾。
但我正在寻找更复杂的方法(可能?)提供更好的结果。我对机器学习知之甚少,因此对主题,技术或算法的指点表示赞赏。
一个小问题:在语言中,如果您生成单词序列(另一个问题)或字母序列(您要求的),可能会生成一个新的单词/字母,考虑到最后**两个**字/字母(而不只是一个)。它仍然涉及相同的算法。其他文字/字母不会产生明显更好的结果。 – Fezvez