我目前的工作在某种OCR(光学字符识别)系统。我已经写了一个脚本来从文本中提取每个字符,并清除(大部分)违规行为。我也知道字体。我现在有例如图像是:OCR和性格相似
M(http://i.imgur.com/oRfSOsJ.png(字体)和http://i.imgur.com/UDEJZyV.png(扫描))
K(http://i.imgur.com/PluXtDz.png(字体)和http://i.imgur.com/TRuDXSx.png(扫描))
C(http://i.imgur.com/wggsX6M.png(字体)和http://i.imgur.com/GF9vClh.png(扫描))
对于所有这些图像,我已经有一种二进制矩阵(1为黑色,0为白色)。我现在想知道是否有某种类似数学投影的公式来查看这些矩阵之间的相似性。我不想依赖图书馆,因为这不是我给的任务。
我知道这个问题似乎有点模糊,也有类似的问题,但我正在寻找的方法,而不是一个包,到目前为止,我无法找到有关该方法的任何意见。这个问题含糊不清的原因是我真的没有必要开始。我想要做的事实际上是在维基百科上描述的:
矩阵匹配涉及将图像与存储的字形逐像素地进行比较;它也被称为“模式匹配”或“模式识别”。[9]这依赖于输入字形与图像的其余部分正确隔离,并且存储的字形具有相同的字体和相同的比例。这种技术最适合打字文本,遇到新字体时效果不佳。这是早期的基于光电池的OCR实现的技术,相当直接。(http://en.wikipedia.org/wiki/Optical_character_recognition#Character_recognition)
如果有人能够帮助我解决这个问题,我将非常感激。