2014-04-08 98 views
0

我正在创建一个python脚本来分析日志文件(例如:http://www.monitorware.com/en/logsamples/apache.php),并且需要我可以用来实现此目的的方法建议。Python脚本分析日志文件

  1. open方法读取日志文件。好。
  2. 计算日志的已用时间?我使用哪种方法从日志行中的特定位置读取?例如:64.242.88.10 - - [07/Mar/2004:16:05:49 -0800] "GET /twiki/bin/edit/Main/Double_bounce_sender?topicparent=Main.ConfigurationVariables HTTP/1.1" 401 12846 在这种情况下,如何计算像年份这样的特定位置之后的经过时间?

    我还需要显示每分钟发送的请求数,发送的数据总量,发送的平均数据量,单个请求发送的最大数据量。
+0

请向我们展示您已经尝试过的代码。描述哪些是有效的,哪些不起作用。 –

回答

1

我想用re模块从文本(搜索,substr等)中提取信息。

然后strptime可能是您的朋友将这些日期时间值转换为日期时间并对它们进行计算。

之后,我会使用numpy.ndarray来存储数据并生成进一步的报告。

我也喜欢matplotlib和功能如hist做出一些不错的情节。