gz

    0热度

    1回答

    我有20个.gz文件我想合并在一起(但仍保留原件)。它们都具有相同顺序的相同变量,并且都有标题。我想将它们合并成一个.gz文件,并且只包含第一个文件的标题。这些文件非常“大”,因此我不能使用R来合并它们,因为它会花费太多时间。

    1热度

    1回答

    我有一个巨大的输入文件,兆兆字节(它是gzipped(.gz))。 我需要分别读取每一行,并决定是否将其添加到一个新的文件。 输出文件也有望在大小TB的,但小,因为我不会添加的所有文件。 有没有一种方法,要做到这在C++使用标准库?我不想使用提升。那可能吗 ?

    0热度

    1回答

    我想从.tar.gz压缩包中读取单个文件的内容。该文件位于tarball的根目录中。有没有一些简单的方法来做到这一点?我正在考虑像data = Tarball.open('myfile.tar.gz').entry('/myentry').content这样的事情吗?

    0热度

    1回答

    我有一个小问题,我有一个服务器上的一个大的41GB的文件,我需要提取它.. 如何,我会去了解它,该文件是在一个tar.gz格式,它将需要24小时在godaddy服务器上,然后它停止由于某种原因 我需要排除一个文件夹名称数据这包含大量的数据40.9gb剩下的只是PHP。 home/xxx/public_html/xxx.com.au/data < <这是文件夹,我不需要 我一直在寻找谷歌和其他网站一

    0热度

    1回答

    我有10行的文件,我正在压缩到Bz2格式,但是当我解压缩它时,我看到生成的文件只有9行。有1.5行数据丢失。这是我的压缩到Bz2的代码。我使用DotNet zip库 https://dotnetzip.codeplex.com/ 以下是压缩代码,我将文件转换为UTF-8和Bz2文件。 static string Compress(string sourceFile, bool forceOverw

    2热度

    1回答

    我有一个大小约120GB的gz文件。我想运行mapreduce,但由于gz文件不可拆分,只有一个映射器能够一次处理该文件。该文件存在于hdfs和本地文件中。 可能的选择我在想: 1)解压缩gz文件并将其存储在hdfs中:首先,需要太多时间来解压缩文件并将解压缩数据放入hdfs中。此外,我不能直接在hdfs中解压文件,因为hdfs没有zcat或gunzip命令。所以我必须做zcat a.gz | h

    1热度

    1回答

    我正在使用.gz扩展名文件,我需要以最少的处理时间从文件中删除特定模式,而不是根本不更改文件。

    0热度

    1回答

    我想用Minizip库(建立在zlib上)打开gz文件。 下面是代码: ...... ...... unzFile uf = unzOpen("MyFile.gz"); ...... 不过的Visual Studio 2013崩溃此消息: 调试断言失败! 文件open.c 线98 表达式:( “无效的文件打开方式”,0) 还有什么意思?

    6热度

    1回答

    我有一个超大或损坏的error_log超大tarbell存档,导致存档在尝试提取时挂起。有没有办法在解压缩之前将其从存档中删除,或者在Mac OS X终端上解压缩该特定文件时解压缩该存档? 我发现然而如何efficiently-remove-files-from-large-tgz这个帖子,我试过--delete标志,但收到此错误: tar: Option --delete is not supp

    1热度

    1回答

    我有一个大小为325 MB的gzip文件。我刚刚发现它从一开始就被截断了361个字节。 请指教我如何从中恢复压缩文件。