1
我正在设计一个基于okapi bm25的python搜索引擎,我应该用什么来存储页面数据(相关性等)以及tf,idf的快速访问? python的架子是否足够适合可扩展的设计?python中BM-25搜索算法的实现
谢谢。
我正在设计一个基于okapi bm25的python搜索引擎,我应该用什么来存储页面数据(相关性等)以及tf,idf的快速访问? python的架子是否足够适合可扩展的设计?python中BM-25搜索算法的实现
谢谢。
我建议你看看wiredtiger它是一个功能强大的keyvalue存储库,比leveldb或bsddb(货架模块使用bsddb)更快,可以构建存储。他们是不同的模式revelant在这里你可以看看关于leveldb或bsddb的问题stackoverflow。