我有一个书籍和作者的数据集,有多对多的关系。Python中的多对多数据结构
约有10^6本书和10^5位作者,每本书平均有10位作者。
我需要对数据集执行一系列操作,例如统计每位作者的书数,或者删除某个作者的所有书籍。
什么是一个好的数据结构,将允许快速处理?
我希望对一些现成的模块,它可以提供的线沿线的方法:
obj.books.add(book1)
# linking
obj.books[n].author = author1
obj.authors[m].author = book1
# deleting
obj.remove(author1) # should automatically remove all links to the books by author1, but not the linked books
我要澄清,我不喜欢使用这个数据库,但要做到这一切在内存。
感谢
把信息放在数据库中? – obelix 2010-08-21 17:28:53
将其放入内存而不是磁盘的数据库中。 – carl 2010-08-21 17:32:12