2011-01-06 51 views
2

假设我有一个方法或其他神经网络来正确地对图像进行模式检测。我应该如何设计一个图像中存在多种图案的神经网络?用于多模式识别的神经网络输出层

假设在图像中有X个要检测的图案,最好的方法是什么? AFAIK输出层神经元值应该是[-1,1]。我如何知道是否有X数量的模式被识别?这是否意味着我必须设置一个硬编码限制它可以识别多少模式(因为输出神经元的数量是固定的)?

回答

0

这是一个以人脸检测为例的建议。描述了Github上的这个Face Detection link以使用Haar分类器检测多个图案(即脸部)。如果您在实施部分下阅读,则说明算法使用scaleOptiontemplateSizeOption参数(以及其他)来控制在图像中检测到多少面孔。这听起来像你应该在给定图像的子空间或窗口中寻找特征(甚至可能是重叠的空间)。

scaleOption - 这个参数用于指定 速率哈尔特征使用 用于面部检测将被缩小。 A 较低比例选项表示将会检测到更多 面部,而较高的 比例选项将执行更快的 检测,但可能会错过输入图像中的某些面部 。默认的 比例值为1.1,这决定了 在每个步骤中增加了10%的特征尺寸。

templateSizeOption - 它是用来 指定最小面积,在其中 搜索脸。如果我们想从 中检测特写图像的人, 的大小应该超过40像素,否则一个25个区域的像素(即 的默认值)就足以让 检测到大量的人脸。

+0

我对使用神经网络感兴趣,不使用其他算法。我原来的问题是,这是可能做到这一点在NN – GantengX 2011-01-09 12:54:05

+0

@ GantengX权利,但我认为这些想法将是有益的想法,即使使用NN。特别是如果你做了一些类似于'templateSizeOption'的东西(也就是说你可能有一个在每个原始图像的子集上使用NN的算法)。 – gary 2011-01-09 18:36:45

0

要做到这一点使用hopfild net.at首先在平等的窗口中提取您的目标并保存在您的网络。然后在图像中进行简单的算法搜索,并随时将网络的SIM与目标进行比较,并为任何目标使用单独的数组来保存结果。最后,在每个数组中提取最近的模式。您可以使用某些图像在开始之前处理原始图像。

0

是的,这可以通过神经网络完成。我认为大多数实际的解决方案都会涉及将神经网络应用于扫描图像的窗口。来自神经网络的多次命中将暗示图像中的多个目标对象。

顺便提一句,神经网络不必位于-1 .. 1.