2016-08-23 16 views
-1

我跑了一个分子动力学模拟,给了我2000个轨迹文件。这些文件的文件名格式为au25-c2-benzalacetone.001,最高为2000.我编写了一个普通的perl程序,但它没有读取2000个文件。如何修改我的代码以便它读取每个文件并分别提取每个文件的坐标?我需要2,000 coordinates_of_interest.dat文件。这里的修补程序文件是au25-c2-benzalacetone文件。这是我写的代码:如何在Perl上正确指定这些变量?

#!/usr/bin/env perl 
use Math::VectorReal; 
use Math::Trig qw/acos/; 
use strict; 
use warnings; 


    my $file1 = $ARGV[0]; 
    my $n1 = $ARGV[1]; 
    my $n2 = $ARGV[2]; 
    my $tinker_file = sprintf "%s.%03d" 

    my($file1, $n1, $n2) = @ARGV; 

    foreach $tinker_file (glob "$tinker_file.*") { 
    print "Filename: $tinker_file\n"; 
    } 

    my $file2 = "coordinates_of_interest.dat"; 
    my %lines_of_interest = map { $_ => 1 } 18, 25, 26; 


{ 
open(FILE2, '>', $file2) or die "couldn't open the file!"; 

for(my $i=$n1;$i<=$n2;$i++){ 
{ 
open(FILE1, '<', $tinker_file) or die "couldn't open the file!"; 
{ 

my $num_lines = keys %lines_of_interest; 

while (<FILE1>) { 
    if ($lines_of_interest{$.}) { 
     print FILE2; 
     last unless --$num_lines; 
       } 
      } 
     } 
     } 
    } 
}                                  



+1

您需要解决几个语法错误(''上$ n1'和'$ n2' my'),'$ i'不与'my',你的'for'未与关闭'}'宣布,你的第一个'open'没有正确终止(缺少')'...)。你应该也可以暗示'close()'你的文件句柄。 –

+0

是的。我即将在此处进行编辑。我运行了代码,它给了我FILE1和FILE2的问题。 –

+0

谢谢@DravSloan –

回答

-1

glob是你的朋友在这里无论是使用通配符使用和搜索目录:

my ($filespec, $n1, $n2) = @ARGV; 

foreach my $file (glob "$filespec.*") { 
    print "Filename: $file\n"; 
} 

或者您可以使用glob扩展模式:

my $expr = join ",", 0..9; 

foreach my $entry (glob ("test.{$expr}{$expr}{$expr}")) { 
    print $entry,"\n"; 
} 

但我可能会坚持与第一个,因为这将确保文件实际存在。

+0

当我加入这个我的代码它给我以下错误:全局符号“$ tinker_file”需要明确包名在./extract_coordinates.pl线15 在./extract_coordinates.pl 15行语法错误附近“$ tinker_file(” –

+0

也许我执行文件命名不正确。 –

+0

我改变了我的代码,以反映你给我的改变哦 –

0

如果文件格式是au25-c2-benzalacetone.001,你的第一个问题似乎是$i可能不是三位数。你可能my $tinker_file = sprintf "%s.%03d", $file1, $i;

我注意到另外一个问题是,你继续稳步开放“coordinates_of_interest.dat”写,没有追加,所以只有最后一个文件将拥有三条线存在。我建议如果您要为所有输入写入单个文件,请在for循环的(之前)之外打开该文件,并在循环结束后关闭它。

0

这些文件的文件名格式au25-C2-benzalacetone.001高达2000

my $tinker_file = sprintf "%s.%03d" 

除了一个事实,即这条线是不完整的,你不能从1适合数字到三位数字的2000年。这可能是您的脚本没有读取所有文件的原因。