我有成千上万个主要以编程方式访问的pdf文件。他们的学术文件,他们的名字开始<the last name of the author in letter><optional digit(s) to distinguish different authors of the same name><period><year><optional letter(s) to distinguish different documents of the same author-year>
)是这样的:将大量文件分割成子目录
Johns1.2000a.pdf
但从编程相关方案的角度来看,这是比较容易,如果所有这些文件都在一个目录。
但是,当我偶尔在GUI文件浏览器上手动打开这些文件时,目录太大以致文件浏览器的响应变慢。因此,我将文件分隔成以文件名的首字母命名的子目录(即文件Johns....pdf
进入子目录J
等)。但
- 我不知道是否有意义要做到这一点,
,也有使用这种方法的问题。
- 首先,文件名相对于首字母不均匀分布;一些字母有更多的文件开始与一些少。
- 其次,如果文件的集合增长,每个子目录会变得太大了,我会去到像
AA
,AB
另一个层面上,...,这- 是任意和特设(我会每当我感觉子目录变得太大时必须手动添加一个级别),并且不均衡分配会变得更糟(例如,目录
QQ
中几乎没有任何文件,但是在KA
中相当多) 。
- 是任意和特设(我会每当我感觉子目录变得太大时必须手动添加一个级别),并且不均衡分配会变得更糟(例如,目录
在这种情况下,
- 这有什么意义,使子目录呢?我只是偶尔手动访问文件,所以我可以忍受文件浏览器的慢速响应。从其他角度来看,有没有这样做的优点?
- 如果创建索引是有意义的,那么有没有一种方法不存在上述问题?
这大多解决了分布不均匀的问题(如果过程可以自动化,则会产生声响)。 (次要)问题是它不能直观地手动访问。但也许我期待太多。 – sawa
在您实施解决方案后,我很乐意在将来看到该问题的更新。 –