我有一个远程驱动器(如\远程\位置)的大量(超过200k)的pdf文件。我必须从该目录中读取所有文件名并将文件名插入到数据库中。Pentaho数据集成“获取文件名”不加载大的文件列表
我试过“获取文件名”的一步。但是它不会加载文件名,并且转换立即停止。
我试过用较少数量的记录在同一个远程目录中,但在一个子目录中。它工作正常。
但是,当我尝试所有文件(包括子目录)它崩溃。出现内存不足的情况。 (Failed to execute runnable (java.lang.OutOfMemoryError: Java heap space))
有没有一种方法可以处理每个1000个文件一次?
什么都大小我给它超过1024米然后它给我的不能够创建虚拟机的错误,所以我能为此做什么? –
buy more RAM; D – jipipayo
mine是8 GB ... –