2016-02-12 43 views
1

我在google云端datalab上运行a notebook。它生成一些中间输出文件。运行笔记本时会显示文件。写入磁盘的文件在一段时间后被删除

但几个小时后,当我再次打开笔记本电脑时,只有datalab git存储库(主要是笔记本文件)中的文件存在,其他所有内容都被删除。笔记本内核似乎也重新启动。

有什么理由?我该如何避免这种情况?

回答

2

Google Cloud Datalab在App Engine Managed VM Environment上运行。这些使用ephemeral disks不保存重新启动之间的数据。

如果中间输出文件需要保留以备将来使用或遵从性原因,则应使用Google Cloud Storage或其他durable mechanism来保存它们。

虚拟机实例内部的存储只适用于临时的一次性数据。

一个相关的问题探讨持久磁盘的使用情况:Using persistent disks with google Datalab

+0

所以IIUC,如果我安装额外的Python模块也不会持续,我需要每次重新安装模块。 – Choghazanbil

+0

我需要时重新运行'%% bash pip install x'。 Datalab目前处于测试阶段,所以我希望这会得到改善。 –