2015-07-19 33 views
0

我基本上遵循一篇论文“使用统计语言模型来改进基于HMM的草书手写体识别系统的性能”。提取图像的轮廓位置和方向

这里作者已经从每个滑动窗口中提取了9个特征的矢量。引用纸张:

前三个特征是窗口的重量,它的中心重力和窗口的二阶矩。

特点四个和五个限定在窗口的上部和下部 轮廓的位置,设有六,七通过在 窗口位置的轮廓的梯度得到的 取向的上和下轮廓,设有8在垂直方向上给出从黑色到白色的 转换的数量,而功能9给出在上部和下部轮廓之间的黑色像素的数量 。

我设法计算出论文的前三个特征,但我似乎无法理解特征4,5,6,7,8。

我可以计算图像的轮廓。假设,这是文本行中的一个(窗口是长度为14个像素的,由纸所建议的)的窗口:

enter image description here

而这是图像的所提取的轮廓:

enter image description here

那么这里的上下轮廓究竟是什么?从哪里可以考虑极限,如果它涉及顶部和底部像素,那么我可以提取那些没有轮廓提取?同样,这些轮廓的方向也同样令人困惑。

我真的很感谢这里的一些指导。

+0

图像不可见。请修改它们。 – NKN

+0

@NKN我在不同的浏览器上试过它,图像正在为我工​​作。你可以请再试一次 – ipunished

+0

这是我看到的图像,也许整个图像应该是这样的,我没有任何想法。 http://pasteboard.co/26C6SF7U.png – NKN

回答

1

我看了一篇文章,并且非常肯定“上”和“下”应该被读作“最高”和“最低”。这尤其有意义,因为作者特别关注对数据进行预处理,以便在水平和垂直两个方向进行归一化处理。他们注意有一种健壮的规模,书写角度,...

我想功能4和5可以是等高线的极值坐标,它结合梯度的功能6 & 7 =方位,可以很好地了解轮廓的这些部分的形状。

特征9将主要用于区分可能具有类似垂直形状的字母,例如“i”,“l”,“j”。

这是我的理解。希望这可以帮助!

+0

感谢您的回答,是的,我已经完成了论文中提到的预处理。所以最低值和最低值是最高像素和最低像素?如果是这样的话,我不能从原始的黑白图像中获取那些图像吗?为什么我必须得到图像的轮廓? – ipunished

+1

我认为轮廓是有用的,原因有两个: - 它们确保图像中没有可能引起错误特征值的伪影(=孤立噪点像素) - 它们规范了特征9,上下轮廓“。使用轮廓可以实际检测黑白转场的数量。所以“l”不会有过渡,但是“i”会因点而有2。 “s”将会有4.这是字母之间的另一个区别。 如果您在白色背景上使用黑色轮廓,第9个功能才有意义。 (与第一篇文章中的图片相反) – Eskapp