我有一个相当大的文件(1.5亿行10个字符)。我需要将它分成两百万行150个文件,每个输出行可以是源行的前5个字符或后5个字符。 我可以在Perl中快速执行此操作,但我想知道是否有使用bash的简单解决方案。 任何想法?在Linux/bash下分割一个文件和它的行
1
A
回答
3
作业? :-)
我会认为一个简单的sed管道(将每行分成两行)和split(将事物分成多个文件)就足够了。
男人的命令是你的朋友。
确认后补充说,这不是功课:
如何
sed 's/\(.....\)\(.....\)/\1\n\2/' input_file | split -l 2000000 - out-prefix-
?
+0
不是作业,只是测试网站。感谢您的回答。 – Sklivvz 2008-09-15 15:33:08
0
我觉得这样的事情可以工作:
out_file=1
out_pairs=0
cat $in_file | while read line; do
if [ $out_pairs -gt 1000000 ]; then
out_file=$(($out_file + 1))
out_pairs=0
fi
echo "${line%?????}" >> out${out_file}
echo "${line#?????}" >> out${out_file}
out_pairs=$(($out_pairs + 1))
done
不知道,如果是简单的或比使用Perl更有效,虽然。
0
每一行变种的前5个字符,假设大文件称为x.txt,并假设它的确定与名称x.txt当前目录下创建文件*:
分裂-l 2000000 X .txt x.txt.out & &(for splitfile in x.txt.out *; do outfile =“$ {splitfile} .firstfive”; echo“$ splitfile - > $ outfile”; cut -c 1-5“$分裂文件“>”$ outfile“;完成)
相关问题
- 1. 分割一个Javascript文件
- 2. 分割的文件一行一行到一个数组
- 3. 想要将文本文件分割为每行一个文件
- 4. 将文件的每一行分割为一个TCL文件中的新文件
- 5. 需要将文本文件的每一行分割成一个总和列表
- 6. 文件分割成一个TFileStream的
- 7. 分割文件分割成多个文件/阵列 - perl的
- 8. 分割一行文字?
- 9. 在J2ME中分割/分割文件
- 10. 分割我的代码分割成多个文件在Python 3
- 11. 分割每行的文件分成n
- 12. 我如何分割一个RTF文件
- 13. 从文件中获取一行并分割成一个数组
- 14. 分割文件分割成多个文件
- 15. 将一个巨大的excel文件分割成多个文件
- 16. 将一个文件分割成多个小文件的优化
- 17. 分割字符串在Java和拿起它的一部分
- 18. 如何在多个条件下分割一个字符串
- 19. 在一个数组中分割一个.txt文件
- 20. 如何分割大文件,并且在每个分割执行命令,因为它完成
- 21. 根据模式将一个文件分割成多个文件(可以在行内发生切割)
- 22. C#中的图像分割(行分割和字符分割)
- 23. 分割文件
- 24. 如何分割一个文件分成多个文本文件中的Unix
- 25. 逐行分割txt文件,并从每行创建一个txt文件
- 26. SH - 分割文件到多个文件
- 27. React Native:如何将一个文件分割成多个文件
- 28. 合并三个文件分割成一个大文件
- 29. 如何将多个文件分割成一个gb文件夹?
- 30. 如何在读/写中分割tex文件中的一行?
我认为你需要更清楚一点转换是什么。 (也就是说,我不明白。)也许是一个小例子? – mweerden 2008-09-15 15:25:30