0
为了做一个关于字符识别的项目,我找到了一个我可以用作训练集的数据库。另一方面,即使给出了下面的说明,我也无法理解给定的格式。如何找出这种格式,我找不到进一步的帮助。了解这个字符数据库格式
字段1-6以逗号分隔。源制品的
- ID号码
- 2字节符号代码(写在十六进制,使用4个字节)的位图 位图的
- 字符宽度
- 位图图像的
- 字符高度,其中每个8位单位被写为0到255的小数
- 换行
下面附加了数据库文件(Google驱动器)的链接。
https://drive.google.com/file/d/0B-WsCQkhd_1iUUtJdHg0R1hfTHM/view?usp=sharing
这将是很大的帮助,如果有人能想出这种格式呈现的方式。这实际上令我困惑。
谢谢你的回应。但我仍然无法分解哪些列是为什么...比如哪一列为高度,哪一列为宽度,哪一列为符号代码等。 –
1列必须是ID。 2-3可能是一个2字符的代码,每列1字节,3 - 高度,4 - 宽度,我无法理解的下一列,但自身位图数据可能从第15列开始,至少所有值在该列之后的范围从0到255,每个值中的每一位代表一个像素(可能),我不确定第5-14列的目的是什么。 –
谢谢,高度和宽度,你的意思是第4和第5列的权利。 –