2012-07-24 73 views
0

我刚刚发现了R,它似乎是获取Web服务器日志文件统计信息的理想工具。我研究了几个库,如zooplyr,但它们都没有提供直接解决方案来聚合时间戳数据。使用R处理日志文件

是否有任何R lib或教程或文档专注于分析日志文件,如数据?哪些强调集中时间片?

可能usecases:

  • 平均每天申请时间每人每天会议
  • 平均请求
  • 得到最慢的请求本周
  • ...
+0

为什么'zoo'和'plyr'不适合你?目前你的问题很模糊,难以回答。你能对你的问题更具体吗?也许发布一些示例数据,并显示你到目前为止尝试过的? – Andrie 2012-07-24 07:10:48

+0

我的问题是一般性的;)我只是想要某种概述,也许有人已经潜心于用R分析日志。我已经“以某种方式”解决了我的问题,但不是以一种优雅的方式。 – 2012-07-24 07:12:54

+0

你为什么要用R来做这个?为什么不使用[AWstats](http://awstats.sourceforge.net)等Web服务器日志分析器程序? – 2012-07-24 11:15:14

回答

2

这种处理时间戳数据的问题其实很常见。因为你的问题含糊不清,我的答案仅限于一些指针。为了聚合时间序列看(这顺便说一句是我自己的所有答案)的例子:

这些答案都使用相同的策略,与plyrggplot2包相结合。这应该让你开始。请注意,这些只是我自己在几分钟内找到的答案。可能还有更多要找的东西,特别是如果你正在寻找更具体的问题。