2017-05-16 58 views
-1

我正在使用OCR来获取单词的边界。找到两个连续边界框之间的距离?

我该如何将两个连续的边界框相互靠得更近?

我实际上试图获取表中特定单元格中存在的所有单词。
例如,在下面给出的图像中,“帐号”和“号码”是两个单独的单词。我想根据这些边界框之间的距离来组合这些边界框。 enter image description here

+2

你需要想出一些东西。没有人会在这里为你写代码。 –

+0

请注意,'59198482'比'NUMBER'更接近'ACCOUNT'。并不是说这是不可能的,但我认为这有点复杂 – user463035818

回答

1

编写一个联合函数来取两个边界框并返回两个包围的边界框。这是微不足道的,只是最大/最小。

然后根据两个组件的面积检查工会区域。如果差值是负数,那么这些方框相互包含,如果它们为零,则它们彼此齐平。如果差异很小,则组件非常接近。如果它很大,那么这些组件相距很远,或者一个比另一个在共同边缘维度上大得多,所以您可能想要拒绝该联合。