在C#中工作我有一个字符串数组。其中的一些字符串是真实的字,其他的则完全是无稽之谈。我的目标是想出一种方法来确定哪些词是真实的,哪些是错误的。在C#中,建立一个字符串是否是一个真正的单词的建议方法是什么?
我已经计划在网上找到某种单词列表,我可以将它带入我的项目,变成列表并进行比较,但当然在“C#词典”中输入的却是一个无关的主题!我不需要100%的准确率。
正规化问题: 在C#中,建议确定字符串是否是真正的单词的建议方法是什么?
建议和指导非常感谢!
解决方案
感谢伟大的答案,他们都是非常有用的。碰巧事情要做的是用不同的措辞提出同样的问题。寻找C#拼写检查提出了一些很好的链接,我最终使用了Nhunspell,你可以通过NuGet获得它,并且非常易于使用。
寻找“C#拼写检查”,这是你基本上在做什么,产生了一些有希望的结果。搜索“开源拼写检查”也有一些。 –
你对“真实单词”一词的使用表明有三种东西:非单词,不真实的单词和真实的单词。这是你打算做出的区别吗?你能为我描述一个区分非单词和单词的测试,还有第二个测试能区分真实的单词和非真实的单词吗?例如,“%&(*&”是一个非单词,“frobbenization”是一个非真实的单词,“汉语/汉语”是一个真正的单词? –
@EricLippert这是一个有效的观点。不,这不是我打算做的区别。给出的答案已经非常好,我猜想其中一个答案会在我以后尝试时为我工作! – MGDavies