2010-10-21 44 views
1

我有一个二进制数据文件,采用相对古老的程序使用的格式,我试图将其转换为理智的格式。在十六进制编辑器的帮助下,我已经基本上制定了文件格式,只是它包含希伯来文字符和奇数编码。翻译奇数希伯来文编码的数据文件

所有字符都是8位。 “标准”27个辅音(包括“最终”辅音)从十六进制到九十九。然后有些元音似乎围绕十六进制9B左右开始(我正好在标准辅音结束后猜测)。然后有一些“虚线”的辅音,它们似乎以十六进制E0开头。

如果我没有记错,我认为这是某种DOS编码。这是什么编码,我应该把它翻译成什么样的编码,以便以色列的用户能够在Microsoft Word中轻松打开它?有没有我可以用来翻译的工具?

回答

1

80至9A似乎与CP862中的码点相匹配,但找不到元音码点的任何匹配。我认为你应该做的只是自定义映射to Unicode并以UTF-8或UTF-16LE纯文本文件生成输出。如果添加物料清单(字节顺序标记),记事本和/或Word应该能够毫无问题地读取它。我可能会制作一个小的Python脚本,但在任何其他语言中都不应该很难。