2013-02-10 75 views
1

我在试验/学习弹簧数据neo4j。我有一个非常简单的应用程序,可以存储来自twitter的推文。请参阅下面的代码片段。索引收集弹簧数据neo4j

​​

问题是,什么是最好的方式来存储哈希标签,以便我可以快速得到他们属于的推文?我能想到的是使用SetIn的@Indexed或实际创建一个单独的Hashtag NodeEntity,并在它和推文之间建立关系。我找不到任何有关在NodeEntity中对集合建立索引的文档,因此我不确定索引是在集合对象上创建还是集合中的每个字符串都建立索引。任何建议都会很好。谢谢。

+0

另请参见示例https://github.com/jexp/sdn-twitter-graph – 2013-02-20 08:11:43

回答

5

当你做一个@Indexed它被放入Neo4j的索引系统,这是Lucene。 Lucene实际上并不索引集合,而是集合的字符串表示。

至于你的数据模型,我会去创建一个HashTag节点,每个Tweet将连接到。您最终会遇到密集型节点问题以寻找更常见的哈希标记,但总而言之,您可以执行更多分析,例如使用相同的哈希标记获取所有推文。

+0

HashTag将是您引用的'@ NodeEntity'。设置标签;然后,SDN会相应地创建关系。 – 2013-02-20 08:11:18