2011-02-05 32 views
7

我有2个关于分析GPS数据集的问题。比较/聚类轨迹((x,y)点的GPS数据)和挖掘数据

1)提取轨迹我有一个巨大的数据库记录的GPS坐标形式(latitude, longitude, date-time)。根据连续记录的日期 - 时间值,我试图提取该人所遵循的所有轨迹/路径。例如;从时间M开始,(x,y)对不断变化,直到时间N。在N之后,(x,y)对中的变化减少,此时我得出结论,从时间MN的路径可以称为轨迹。当提取轨迹时,这是一种体面的方法吗?有什么可以建议的着名方法/方法/算法吗?是否有任何数据结构或格式可以帮助我以高效的方式维护这些点?也许,对于每个轨迹,计算出速度和加速度会很有用?

2)挖掘轨迹一旦我有所有的轨迹/采取的路径,我怎么能比较/群集他们?我想知道起点或终点是否相似,那么中间路径如何比较?

如何比较2个路径/路径,并得出它们是否相似。此外;我如何将相似的路径聚集在一起?

我非常感谢,如果你能指点我的研究或类似的事情。

开发将在Python中进行,但欢迎各种图书馆建议。

在此先感谢。

+2

Check out您的标签。他们都不是很受欢迎。我会考虑将`gps`改为`gis`,并确定添加`python`标签。 – 2011-02-06 19:08:17

+0

您可能会考虑在http://gis.stackexchange.com/ – radek 2011-02-06 22:20:42

回答

9

查看苏黎世大学地理系完成的工作,特别是Patrick LaubeSomayeh Dodge

看一看纸

个体运动和地理数据挖掘。聚类 算法高亮热点在个人导航路线

linkpresentation)。它展示了在GPS数据中使用DBSCAN核密度估计方法。

同样来自诺基亚的Mobile Data Challenge 2012 Workshop论文在这儿可以帮忙,特别是:

MobReduce:减少流动性状况复杂的费边哈特曼,克里斯托弗P.梅耶,英格玛Baumgart跟踪(link

用于轨迹聚类的轨迹清理框架(link

作者:Agzam Idrissov,Mario A.阿尔伯塔大学纳西门托

1

1)提取轨迹 我认为你是正确的方向。 GPS数据中可能会有一些噪音,随机行走,你应该做一些光滑的样条来克服它。


2)采矿轨迹 是否有类似的轨迹任何商业意义? (这将有助于建立距离度量标准,然后你可以使用一些mahoot聚类算法) 1.我认为有些人停留的地方更有趣,所以你可以生成地方受欢迎程度的统计数据。 2.如果您需要路由相似性来查找到相同起始端的不同路径,则需要将首个起始端位置和类似曲线(最大距离间距,积分距离 - 一些众所周知的功能度量标准)聚类到一起。