3

假设您想要预测下次该船将作为概率访问的时间。 您开始在船周期的任意位置进行观测。 当您进行观察时,您只能记录船只是否可见(假设它是船上始终可见的周期中的正确点)。 在这个世界上,船的周期长度也是未知的但是周期性的,并且船访问持续时间是未知的,但总是比周期长度更小的小于。同样假设周期是可能不会改变的固定自然现象。用于检测未知周期中的位置的算法(时间序列)

案例1.观察的第一个小时你没有看到一条船。因此预计在下一个小时内有船的可能性将是任意的。第二个小时,我们观察一条船,我们预测3小时的概率很高。小时4我们没有观察船,我们现在可以确定船通常可以观察2小时(第2小时和第3小时)。我们继续进行观察,7小时后船再次可见。只有在这一点上,我们才知道船的周期长度(5小时)和船可观察的持续时间(2小时)。

案例2.第一小时的观察,你看到一条船。预计下一小时的概率很高。在第四小时,你没有观察到船只。此时船可见度至少为3小时。我们在5小时,6小时,7小时,8小时再次观察船,9小时没有船。只有在小时9之后,我们可以安全地说周期为5小时,能见度为4小时。

案例3.第一个小时,你看到一条船。你去睡3个小时。在第5小时,你看不到一条船。你去睡3个小时。在第9小时,你会看到一条船。 10,11,12几小时看到一艘船的概率是多少?

我可以用什么算法来解决这个问题?我在想一个隐藏的马尔可夫模型可能会工作,因为有一个潜在的现象,但它不是直接可观察的。但在这种情况下,现象并不完全清楚。在我的具体情况下,我可以用平均周期长度初始化算法。创建这种算法的真正动机是观察结果之间的差距很小。这个程序在训练阶段是最有价值的,因为如果周期长度和我们在周期中的位置是已知的,事情就会变得微不足道。

下面大致有什么可以输出给定的0,1,2和3个连续观测(X意味着看到小船的观察,O表示无舟),使用的小时的平均历史周期长度,船的持续时间为小时。仔细观察图表,你会注意到在船只可能返回的地方,可能性增加了。 internal probability distribution

+1

期间是一个整数吗?也就是说,模式重复完美吗? – Beta 2012-07-13 11:23:46

+0

看来你想估计伯努利定律的参数;或不? – Bentoy13 2012-07-13 11:23:55

+0

@贝塔假设这是。该模式完美重复,但在算法开始时是未知的。当然,如果我们用概率工作,我们可以解释异常值。如果我们使用HMM,我们可以通过学习来更新内部权重,以解释现象本身行为的逐渐变化。 – 2012-07-13 11:54:00

回答

0

我不是这种造型的专家,但我建议你保持竞争的理论

案例1:
小时1:没有船。所以“关闭”阶段的长度至少是一个,关闭阶段的长度可以是任何东西。我们可以把它写成[1+,0+]。周期的长度是(1+)+(0+)= 1+。
小时2:船。这个模型现在是[1+,1+],它不能预测第3小时,但我们已经经常看到这艘船,所以我们计算出1/2的概率。循环的长度是2+。
小时3:没有观察。理论分裂。如果没有船,我们会有[1 +,1](并预测1/3);如果有船,我们会有[1 +,2+](并预测2/3)。所以我们的模型是{[1 +,1],[1 +,2 +],我们预测1/2。
小时4:没有船。我们修改理论:{[2 +,1],[1 +,2]}并预测3/8。
小时5:没有obs。模型再次分叉:
[2 +,1] - > [3 +,1],[2,1]
[1 +,2]→[2 +,2],[1,2]
请注意,这些理论中的两个声称是完整的(但对小时6做出相反的预测)。预测是2/5或40%。
小时6:没有obs。不完全理论分歧:
[3 +,1]→[4 +,1],[3,1]
[2,1]
[2 +,2]→[3 +,2], [2,2]
[1,2]
预测为1/4。
小时7:船。这种拆除三个理论,维护了一个,完成一个,并且使得一个分裂:
[4 +,1] - > [4,1]
[3,1]
[2,1]

[3 + 2] - >并[3,2]
[2,2]
[1,2]
周期是5,能见度是1或2小时。小时8的预测是1/3。

案例2:
小时1:小船。 [0 +,1 +]
小时2:没有obs。 [1 +,1 +],[0 +,2 +]。预测3/4。
小时3:没有obs。 [2 +,1 +],[1,1+],[1 +,2 +],[0 +,3 +]。问题2/3。
小时4:没有船。 [3 +,1 +],[1,1],[2 +,2 +],[1 +,3 +]。问题5/8。
小时5:船。 [3,1 +],[1,1],[2,2 +],[1,3+]。 Prob 3/5。
小时6:船。 [3,2 +],[2,2 +],[1,3+]。问题2/3。
小时7:船。 [3,3+],[2,3+],[1,3+]。问题5/7。
小时8:船。 [3,4 +],[2,4 +],[1,4+]。 Prob 3/4。
小时9:没有船。 [3,4],[2,4],[1,4]。问题1/3。能见度是4小时,但时间段未知。

我不会在案例3中工作,但您明白了。