2014-03-12 33 views
0

我已经做了任何真实的统计,但我希望Stack Overflow社区可以提供帮助。虽然我不能给出具体的应用程序,但它是一个等效的问题:如何确定随机周期性过程的等待时间的期望值?

想象一下您的房子附近有一个公共汽车站,但您不知道公交时刻表。相反,你有一个列表确切的时间公交车有实际上抵达去年。我想要做的是计算以下内容:如果你随机前往公共汽车站,5分钟内有公共汽车的概率是多少? 10分钟? 20分钟? (我想要分配)。

我已经尝试过在Google上搜索,并且发现了大量使用累积分布函数的示例......但是,我还没有找到一个如何做上面我想要的示例。

特别是,我希望使用去年的样本来创建我希望使用的概率分布函数。

有没有人有一个很好的例子,我会如何去做这件事? (或一个网站,有这样的数据?)

+1

你希望泊松分布,至少作为一个开始。其典型应用是建模到达等待时间。其他答案是正确的,你可能想看看到达时间泊松*有条件*在一天中的时间,但泊松是第一次去的方式 –

回答

1

我可以给你一些建议可能会帮助:

1-为了得到更准确的结果,你需要有一天的时间条件分布(即高峰期或非高峰期)和星期几(星期几或周末),因为公交车班次取决于这些因素

2-尝试计算两条公交车(即车间间距)关于上述因素。任何人随意到达公交车站的预计等待时间等于车速的一半。

所以我会这样做的方式是将数据集分成不同的时间段(例如平日7-10am),然后计算这段时间的进度,这将是我的分布,我将用它来计算预期的等待时间时间随机到达公共汽车站

等待时间可以建模为指数分布,我也想测试,如果公交车到达过程遵循泊松分布(你必须用数据来检验,不只是假设它),正如我上面提到的,你必须在一天中的某个时间和一周中的某一天限制你的分配。

+0

感谢您的建议:),我同意我们需要在公交时间表上做类似的事情,但我只是以巴士为例。真正的过程是相当规律的,并且非常周期性地重复...想象一下,你有n辆公共汽车可以为你提供服务。巴士的总数是有限的,但你不知道那些巴士的个别时期,但知道它们是规则的和循环的。 – Aerophilic

+0

这取决于您的数据中是否包含总线标识符或否。此外,如果该人将采取第一辆巴士或等待特定的巴士线路。但总体来说,如果数据*证实了这一点,即公交车到达过程可以模拟为“Posion分布”,即这意味着平均值和方差相等 – iTech

0

我的建议是使用经验分布,即直方图。您可以根据任何重要的因素分割可用数据,例如平日与周末在公交车上的例子。顺便提一句,请注意,如果到达时间大致是循环的,正如您所提到的,等待时间取决于您何时开始等待。

在构建直方图并查看它们之后,您可能会发现通过假设某些特定的分布可以简化事物。但是,你必须首先处理经验数据以确定这是否可行。