2011-06-04 51 views
1

考虑下面的数据集我的网站上一篇文章:基本速度算法?

Article 1 
2/1/2010 100 
2/2/2010 80 
2/3/2010 60 

Article 2 
2/1/2010 20000 
2/2/2010 25000 
2/3/2010 23000 

,其中第1列是日期,第2列是浏览量为物品的数量。什么是可以做的基本速度计算来确定这篇文章在最近3天内是向上还是向下?

注意事项,文章将不知道浏览量总数只有他们自己的总数。理想情况下,数字在0和1之间。指向这类算法的指针是什么?

谢谢!

回答

3

更新:你的数据实际上已经速度(浏览量/天)的列表。以下答案简单地显示如何查找过去三天的平均速度。请参阅我的other answer了解如何计算浏览量加速,这是您可能正在寻找的真实统计数据。

Velocity是简单地在一个值(增量浏览量)随时间的变化:

对于物品1上2010年2月3日:

delta pageviews = 100 + 80 + 60 
       = 240 pageviews 
delta time = 3 days 

pageview velocity (over last three days) = [delta pageviews]/[delta time] 
             = 240    /3 
             = 80 pageviews/day 

关于第2对2/3/2010:

delta pageviews = 20000 + 25000 + 23000 
       = 68000 pageviews 
delta time = 3 days 

pageview velocity (over last three days) = [delta pageviews]/[delta time] 
             = 68,000   /3 
             = 22,666 + 2/3 pageviews/day 

现在我们知道的最大速度,我们可以扩展所有的速度得到0和1之间的相对速度(或0%和100%之间):

relative pageview velocity of article 1 = velocity/MAX_VELOCITY 
             = 240 /(22,666 + 2/3) 
             ~ 0.0105882353 
             ~ 1.05882353% 

relative pageview velocity of article 2 = velocity /MAX_VELOCITY 
             = (22,666 + 2/3)/(22,666 + 2/3) 
             = 1 
             = 100% 
+0

那么您是否像思考速度时间图那样思考? – James 2011-06-04 02:58:48

+0

@James:您也可以将其视为浏览量时间图。速度是任何时候浏览量功能的瞬时斜率。 – Leftium 2011-06-04 03:06:34

+0

你说的delta浏览量是什么意思?你想要给你三角洲的计算是什么? – James 2011-06-04 03:18:15

1

“网页浏览趋势” 可能指的是网页浏览加速度,而不是速度。您的数据集实际上是已经是速度列表(网页浏览量/天)。综合浏览量是非递减值,因此综合浏览量速度永远不会是负面的。以下介绍如何计算浏览量加速,这可能是负面的。

PV_acceleration(t1,t2) = (PV_velocity{t2} - PV_velocity{t1})/(t2 - t1) 
("PV" == "Pageview") 

说明: 加速简单地在速度通过改变在时间上被划分改变。由于数据集是页面浏览速度的列表,你可以直接将它们插入公式:

PV_acceleration("2/1/2010", "2/3/2010") = (60 - 100)/("2/3/2010" - "2/1/2010") 
             = -40  /2 
             = -20 pageviews per day per day 

注为“2010/2/2”数据没有被使用。另一种方法是计算三个PV_accelerations(使用仅返回一天的日期范围)并对它们进行平均。没有你的榜样,以三天做了足够的数据,但在这里是如何做到这一点的最后两天:

PV_acceleration("2/3/2010", "2/2/2010") = (60 - 80)/("2/3/2010" - "2/2/2010") 
             = -20  /1 
             = -20 pageviews per day per day 

PV_acceleration("2/2/2010", "2/1/2010") = (80 - 100)/("2/2/2010" - "2/1/2010") 
             = -20  /1 
             = -20 pageviews per day per day 

PV_acceleration_average("2/3/2010", "2/2/2010") = -20 + -20/2 
               = -20 pageviews per day per day 

这种替代方法并没有发挥作用的第1个数据,因为页面视图加速度在两天之间没有变化,但是它会对第2条产生影响。