0
我正在使用打开细化来清理工作表(.csv)中的一些地址。如何在列中对完全匹配进行聚类?看来聚类算法会聚集几乎相似的地址,这些地址只在数量上有所不同。例如:使用OpenRefine清理地址 - 群集完全匹配
56, LORONG RENGAS, SELANGOR
76, LORONG RENGAS, SELANGOR
90, LORONG RENGAS, SELANGOR
76, lorong rengas, selangor
56, LORONG RENGAS, SELANGOR
如何使用OpenRefine根据精确匹配集群这些地址?问题听起来很愚蠢,但我在这件事上失去了理智。
谢谢
谢谢,我观看了视频,并且在破解了我的头脑之后,我终于设法通过调整参数进行聚类。 – antsemot 2014-12-12 05:00:37