1
我有一个1500万字的语料库,我希望将其存储在数据库中。然后,我希望能够找到给定的单词,它在语料库中的上下文。例如,对于单词“朋友”我可能会选择以下内容,其中我也选择五个字前后各有“朋友”:在1500万字的语料库中查找单词的句子
... night i went to my FRIENDS house for a cup of tea ...
... what did you say my FRIENDS cat is sick and ...
... if you like my FRIENDS dad can pick you up ...
如何最好的,我会安排我的数据库有效针对给定的选择用这种方式说话?当我需要数据库时,我通常使用sqlite,但在这种情况下可能还有其他更好的东西。
听起来像您正在寻找[全文搜索](http://en.wikipedia.org/wiki/Full_text_search)。数据库可能不是最好的选择。 –