我从一个服务中收集完整的HTML,这个服务提供对大量博客和新闻网站的访问。我正在检查HTML(实时)以查看它是否包含一些关键字。如果它包含其中一个关键字,我将HTML写入一个文本文件进行存储。Java文本文件大小(在文件关闭之前)
我想这样做一个星期。所以我正在收集大量的数据。测试程序3分钟产生100MB的文本文件。我有4TB的空间,我不能用这个以上。
另外,我不希望文本文件变得太大,因为我认为他们会成为未打开。
我所建议是打开一个文本文件,并写入HTML它,经常检查其大小。如果它变得比200MB更大,我关闭文本文件并打开另一个文件。我还需要记录总共使用了多少空间,以便我可以确保不会接近4 TB。
我在这一点上的问题是如何检查的文本文件的大小的文件已经被关闭前(使用FileWriter.close())。有没有这个功能,或者我应该计算写入文件的字符数量并使用它来估计文件大小?
一个单独的问题:是否有方法来减少我的文本文件占用的空间量?我在Java工作。
一个单独的问题应该是一个单独的问题。 – beny23