2014-12-04 26 views
0

我正在使用打开细化来清理工作表(.csv)中的一些地址。如何在列中对完全匹配进行聚类?看来聚类算法会聚集几乎相似的地址,这些地址只在数量上有所不同。例如:使用OpenRefine清理地址 - 群集完全匹配

56, LORONG RENGAS, SELANGOR 
76, LORONG RENGAS, SELANGOR 
90, LORONG RENGAS, SELANGOR 
76, lorong rengas, selangor 
56, LORONG RENGAS, SELANGOR 

如何使用OpenRefine根据精确匹配集群这些地址?问题听起来很愚蠢,但我在这件事上失去了理智。

谢谢

回答