2011-10-27 68 views
0

我一直在研究http://www.hackerfactor.com/blog/index.php?/archives/432-Looks-Like-It.html&comment-submitted#feedback的例子,我试图在处理完图像后创建一个散列。如果您对从图像像素创建的二进制字符串进行散列,然后查看汉明距离来分析照片的不同,创建哈希距离的哈希值与对原始二进制字符串做汉明距离有什么区别?散列创建仅仅是为了加快速度?为什么在感性散列中创建散列?

我不太了解哈希。我假设在这种情况下,它们是用于几乎相同照片的过滤机制?但是这不是通过缩小照片并将其转换为灰度来实现的吗?

回答

1

博客文章中提出的想法是如何识别类似的图片。目标是丢失正确的信息,以便留下的是重要且易于比较的信息。所以有两个方面:你可以比较多快和多准确。如果您将图片缩小为8x8黑白(即64位信息),那么将其称为“原始咬字符串”或“长哈希”并不重要(正如@Blender指出的那样这个术语在传统使用中并不是真正的散列)。重要的是如何减少它,留下什么信息和丢失什么。