您可以使用有偏序的页面排名,如Haveliwala在此article中所述。
这个想法很简单,而不是使用一个普通的随机组件:[1/n,1/n,....,1/n]
,使用一个有偏向的随机组件,当你随机行走时,而不是以概率1/n进入每个页面,概率f(doc)
,其中f(DOC)是较新的页面较高,Sigma(f(doc)) = 1
[集合中的所有文档,让您的随机成分会[f(doc1),f(doc2),...,f(docn)]
请注意,每个文件必须是f(doc)>0
,否则衔接不保证[Perron-Frobenius定理不适用]。
另一种可能性是计算定期网页排名,和相乘它与一个不同的功能g:Collection->R
给出一个数值,以各页面,并且页面是较新的,得分越高为此文档。
编辑:
作为响应原来的问题的编辑:
另一种可能性是生成用于所述纸幅的曲线图的情况下,添加额外的信息w:E->[0,1]
,意思是:添加的权重函数对于每个边缘,dentoing多么重要是,如果链接是在原始编辑后不久创建的,则w(e)将接近1,并且如果它晚得多,分数将更接近于0.
创建矩阵时,计算pagerank on ,把Matrix[v1][v2] <- w((v1,v2))
,而不是一个简单的二进制值表示边缘存在于图表中。
一旦你有这个矩阵,一般计算PageRank。
最好呈现算法,你尝试它,但你不能从最早的日期改变它到最新的日期。 –
@SaeedAmiri:OP明确提及他使用的算法:pagerank。这个问题很明显,熟悉这种算法的人都很熟悉。 – amit
@amit,我知道pagerank但它有一些变化,OP没有提到他为什么不能使用它(有一个小的变化)来使用最新的帖子。 –