2010-04-04 41 views
6

不好意思问这种问题,但是因为我真的很需要一些关于如何使用多探针LSH的指导,所以我自己并没有做过多的研究。我意识到有一个实现该算法的lib调用LSHKIT,但我无法弄清楚如何使用它。 现在,我有几千个特征矢量296尺寸,每个代表一个图像。该矢量用于查询用户输入图像,以检索最相似的图像。我用来推导矢量之间距离的方法是欧氏距离。关于多探针局部敏感散列的问题

我知道这可能是一个相当低调的问题,但你们是否知道我该如何实现多探头LSH?我非常感谢任何答复或回复。

- 更新 -

试图建立为我与所提供的工具fitdata数据的模型,但它似乎并没有对我的文件。我用于输入的格式是这种格式,浮点大小:4,数据数量:20,维度:297,和我的数组297 dimenison浮点数组。但它给我这个错误

gsl: init_source.c:29: ERROR: matrix dimension n1 must be positive integer 
Default GSL error handler invoked. 
Aborted 

你们有什么想法如何为fitdata创建一个输入?

- 更新 -

对不起,我迟到更新后,尝试LSH。您可以使用text2bin格式化fitdata的数据。文本文件包含图像或音频文件的特征向量,每行代表一个向量。之后,使用mplsh-tune获取M和W参数。 要构建索引,可以使用扫描工具对一组必需的查询进行采样,并且可以使用mplsh-run获取索引。 现在我想弄清楚如何使用索引以及如何将库链接到我的编码中。任何机构对此有任何想法?

回答

6

让我来指点一下spectral hashing,这会让LSH的屁股时间大打折扣。奖励:他们有matlab代码on their website,您可以使用或验证您自己的实施。而且,实施起来也更容易。

+0

感谢您的指导!我会看到我可以用它做什么,因为我不知道matlab = x – Yijinsei 2010-04-04 20:05:01