0
我堆叠使用熊猫来追加每个文件。通过熊猫追加每个目录和文件
我有每日目录,每个目录有相同的名称文件。
这里是一个例子。
- api.log,click.log,id.log位于20150401目录。
- api.log,click.log,id.log位于20150402目录。
- api.log,click.log,id.log位于20150403目录。
- api.log,click.log,id.log位于20150404目录。
我想将api.log收集到一个数据框中。
import os
from pandas import DataFrame
import pandas as pd
dir_list = ['20150401','20150402','20150403','20150404']
counter = 0
var_box = pd.DataFrame()
for dir_date in dir_list:
next_path = current_path+"/"+dir_date
os.chdir(next_path)
df = pd.read_csv('api.log',sep="\t",names=['date_time','param','oid','url'],na_values=['NULL'])
try:
if counter == 0:
var_box2 = var_box.append(df)
counter += 1
else:
var_box3= var_box2.append(df)
counter += 1
except Exception as e:
print e.message
print(var_box3)
我检查了这个结果,但var_box3没有每个api.log文件。
感谢您的阅读
其中计数器声明?不应该在尝试之外声明并初始化为0,除非? – EdChum
命名变量1,2,3等是您应该使用列表类型的典型符号。你的代码有其他问题,但你应该在尝试使用像熊猫这样的包之前真正了解python迭代。 https://docs.python.org/2/tutorial/controlflow.html – firelynx