python逐行数据处理

我是python的新手，我搜索了一些文章，但没有找到正确的语法来读取文件并在python中执行awk行处理。我需要你的帮助来解决这个问题。python逐行数据处理

这是我的构建和部署的bash脚本看起来，我读了bash中的configurationf文件，如下所示。

backup    /apps/backup 
oracle    /opt/qosmon/qostool/oracle oracle-client-12.1.0.1.0

和bash的阅读部分的脚本看起来像下面

while read line 
    do 
    case "$line" in */package*) continue ;; esac 
    host_file_array+=("$line") 
    done < ${HOST_FILE} 
for ((i=0 ; i < ${#host_file_array[*]}; i++)) 
    do 
    # echo "${host_file_array[i]}" 
    host_file_line="${host_file_array[i]}" 

    if [[ "$host_file_line" != "#"* ]]; 
    then 
     COMPONENT_NAME=$(echo $host_file_line | awk '{print $1;}') 
     DIRECTORY=$(echo $host_file_line | awk '{print $2;}') 
     VERSION=$(echo $host_file_line | awk '{print $3;}') 

     if [[ ("${COMPONENT_NAME}" == *"oracle"*) ]]; 
     then 
     print_parameters "Status ${DIRECTORY}/${COMPONENT_NAME}" 
     /bin/bash ${DIRECTORY}/${COMPONENT_NAME}/current/script/manage-oracle.sh ${FORMAT_STRING} start 
     fi 
    etc .........

如何同样可以conveted到Python。这是我迄今在python中准备的。

f = open ('%s' % host_file,"r") 
array = [] 
line = f.readline() 
index = 0 
while line: 
    line = line.strip("\n ' '") 
    line=line.split() 
    array.append([]) 
    for item in line: 
     array[index].append(item) 
    line = f.readline() 
    index+= 1 
f.close()

我试图在Python分裂，因为它们的配置文件没有在所有的行相等的列数，我得到的指数必然错误。什么是处理它的最好方法。

来源

2014-04-04 user3493124

我觉得字典这里可能是一个不错的选择，你可以生成它们如下：

>>> result = [] 
>>> keys = ["COMPONENT_NAME", "DIRECTORY", "VERSION"] 
>>> with open(hosts_file) as f: 
...  for line in f: 
...   result.append(dict(zip(keys, line.strip().split()))) 
...  
>>> result 
[{'DIRECTORY': '/apps/backup', 'COMPONENT_NAME': 'backup'}, 
{'DIRECTORY': '/opt/qosmon/qostool/oracle', 'VERSION': 'oracle-client-12.1.0.1.0', 'COMPONENT_NAME': 'oracle'}]

正如你看到这将创建一个字典列表。现在，当您访问字典时，您知道其中一些可能不包含'VERSION'密钥。有多种处理方法。您可以使用try/except KeyError或使用dict.get()获取值。

例子：

>>> for r in result: 
...  print r.get('VERSION', "No version") 
...  
... 
No version 
oracle-client-12.1.0.1.0

来源

2014-04-04 10:46:31 msvalkon

我更关心的是下面，我已经写在bash线。为（（I = 0; I <$ {＃host_file_array [*]};我++））做＃回声 “$ {host_file_array [I]}” host_file_line = “$ {host_file_array [I]}” 如果[[“$ host_file_line”！=“＃”*]]; then COMPONENT_NAME = $（echo $ host_file_line | awk'{print $ 1;}'） DIRECTORY = $（echo $ host_file_line | awk'{print $ 2;}'） VERSION = $（echo $ host_file_line | awk'{打印$ 3;}'） if [[（“$ {COMPONENT_NAME}”== *“oracle”*）]]; – user3493124

更新了我的答案 – msvalkon

result = [line.strip().split() for line in open(host_file)]

来源

2014-04-04 10:56:33 dugres

python逐行数据处理

回答

相关问题