我想获得一些社区对良好设计的一致意见,以便能够存储和查询单词频率计数。我正在构建一个应用程序,在该应用程序中,我必须解析文本输入并存储单词出现的次数(随着时间的推移)。因此,考虑以下输入:跟踪/计数字频率
- “杀死一只小八哥”
- “惩戒钢琴玩家”
将存储以下值:
Word Count
-------------
To 1
Kill 1
A 2
Mocking 2
Bird 1
Piano 1
Player 1
和更高版本能够快速查询给定任意单词的计数值。
我目前的计划是简单地将单词和计数存储在数据库中,并依靠缓存单词计数值......但是我怀疑我没有获得足够的缓存命中时间以使其成为长期可行的解决方案。
任何人都可以提出算法,或数据结构,或任何其他想法,可能会使这一表现良好的解决方案?