4

我注意到,存储在分隔标签文件中的相同数据似乎占用的空间少于以逗号分隔文件存储数据时的空间。为什么制表符分隔的文件占用的空间少于逗号分隔的空间?

我的第一个想法是,制表符比逗号字符需要更多的空间,但是我能找到的所有信息都表明它们在UTF/Ascii中占用相同数量的磁盘空间。

+1

根据csv数据的不同,逗号分隔符可能会强制csv保存以包含数据(如果它们包含逗号),而tab不太频繁,因此在保存数据时不需要包含数据。 – dweeves

+0

我使用tsv b/c tsv看起来比csv冷却,它使用标签分隔值更有意义......如果你在文本编辑中打开它,你可以解释它 –

回答

9

CSV版本可能在数据字段周围有“引号”(以防它们自己包含逗号)。

+0

有趣和可能相关 - https:// ronaldduncan。 wordpress.com/2009/10/31/text-file-formats-ascii-delimited-text-not-csv-or-tab-delimited-text/ –

相关问题