2017-05-04 23 views
1

我正在将CNTK的培训和评估配置从Brainscript迁移到Python。由于我们的训练数据是在map/reduce框架中创建的,因此我将图像和标签存储在一个巨大的文本文件中,该文件包含base64编码图像作为其中一列。这一切都运行良好,但我仍然没有找到一种方法来做Python中的等价物。用于Python中base64编码图像的CNTK阅读器

我CNTK.exe配置类似于this example configuration

deserializers = ({ 
     type = "Base64ImageDeserializer" ; module = "ImageReader" 
     file = "myFile.tsv" 
... 

所有Python示例(例如this one)使用ImageDeserializer,其从作为单个文件的图像的读取。我还没有在Python代码cntk.io中发现任何听起来像base64图像解串器的东西。

如何通过Python在CNTK中使用base64编码图像?

一个相关的问题:Brainscript Base64ImageDeserializer接受第一列中包含序列ID的文件,这对于我们在测试时识别单个示例至关重要。我如何在Python中使用它?

回答

1

对Python的Base64反序列化器支持已合并为主。有关示例用法,请参阅/bindings/python/cntk/io/tests/io_tests.py test_base64_image_deserializer。

关于获取标签 - 目前没有简单的方法,您可以编写将包含ID的CNTKTextFormat。但这很麻烦,我们正在讨论使这更容易。