对于我的一个课程,我们需要计算访问网站的用户的会话长度。我们被给了一个网络日志。该网络日志的格式如下:确定网站的会话时间
IPAddress date httpMethod httpStatus size referrer browserInfo
- 的
httpMethod
看起来是这样的:GET /include/main_page.css HTTP/1.1
- 引用者总是主页:
http://www.cs.myCollage.com
或-
我使用的超时值20分钟。
问题: 我不知道如何判断会话何时结束,而不是超时。超时结束会话的唯一方法是什么?有没有办法检测用户何时离开站点(仅使用日志中的信息)?
这是我目前的战略(假设我们有这些日志):
IPAddress Time httpMethod ...
IP1 2:15 GET something
IP1 2:17 GET something else
IP1 2:30 GET something else
IP1 4:30 GET something else
IP1 4:32 GET something else
这意味着用户有过两次会议。我认为第一场会议是或者 15分钟或 35分钟。我应该在会话时间中包含超时吗?
第二次会议将在2分钟到22分钟之间。
这个问题与算法有关,但与其他标签只有短暂的关系。如果你只给了它'算法'标签,你可能会有更多的意见。标签“解析”更多的是这个问题的精神,而不是“网络”或“网络开发”。 – Dialecticus 2010-11-13 00:43:33