提取图像的轮廓位置和方向

我基本上遵循一篇论文“使用统计语言模型来改进基于HMM的草书手写体识别系统的性能”。提取图像的轮廓位置和方向

这里作者已经从每个滑动窗口中提取了9个特征的矢量。引用纸张：

前三个特征是窗口的重量，它的中心重力和窗口的二阶矩。

特点四个和五个限定在窗口的上部和下部轮廓的位置，设有六，七通过在窗口位置的轮廓的梯度得到的取向的上和下轮廓，设有8在垂直方向上给出从黑色到白色的转换的数量，而功能9给出在上部和下部轮廓之间的黑色像素的数量。

我设法计算出论文的前三个特征，但我似乎无法理解特征4,5,6,7,8。

我可以计算图像的轮廓。假设，这是文本行中的一个（窗口是长度为14个像素的，由纸所建议的）的窗口：

enter image description here

而这是图像的所提取的轮廓：

enter image description here

那么这里的上下轮廓究竟是什么？从哪里可以考虑极限，如果它涉及顶部和底部像素，那么我可以提取那些没有轮廓提取？同样，这些轮廓的方向也同样令人困惑。

我真的很感谢这里的一些指导。

来源

2015-07-19 ipunished

图像不可见。请修改它们。 – NKN

@NKN我在不同的浏览器上试过它，图像正在为我工作。你可以请再试一次 – ipunished

这是我看到的图像，也许整个图像应该是这样的，我没有任何想法。 http://pasteboard.co/26C6SF7U.png – NKN

我看了一篇文章，并且非常肯定“上”和“下”应该被读作“最高”和“最低”。这尤其有意义，因为作者特别关注对数据进行预处理，以便在水平和垂直两个方向进行归一化处理。他们注意有一种健壮的规模，书写角度，...

我想功能4和5可以是等高线的极值坐标，它结合梯度的功能6 & 7 =方位，可以很好地了解轮廓的这些部分的形状。

特征9将主要用于区分可能具有类似垂直形状的字母，例如“i”，“l”，“j”。

这是我的理解。希望这可以帮助！

来源

2015-07-19 19:29:49 Eskapp

感谢您的回答，是的，我已经完成了论文中提到的预处理。所以最低值和最低值是最高像素和最低像素？如果是这样的话，我不能从原始的黑白图像中获取那些图像吗？为什么我必须得到图像的轮廓？ – ipunished

我认为轮廓是有用的，原因有两个： - 它们确保图像中没有可能引起错误特征值的伪影（=孤立噪点像素） - 它们规范了特征9，上下轮廓“。使用轮廓可以实际检测黑白转场的数量。所以“l”不会有过渡，但是“i”会因点而有2。 “s”将会有4.这是字母之间的另一个区别。如果您在白色背景上使用黑色轮廓，第9个功能才有意义。（与第一篇文章中的图片相反） – Eskapp

提取图像的轮廓位置和方向

回答

相关问题