我已经运行了https://github.com/percyliang/brown-cluster以及python实现https://github.com/mheilman/tan-clustering的棕色聚类算法。他们都给每种独特的令牌提供某种二进制和另一个整数。例如:布朗聚类算法输出意味着什么?
0 the 6
10 chased 3
110 dog 2
1110 mouse 2
1111 cat 2
二进制和整数是什么意思?
从第一link,二进制称为一个bit-string
,看到http://saffron.deri.ie/acl_acl/document/ACL_ANTHOLOGY_ACL_P11-1053/
但我怎么从输出告诉dog and mouse and cat
是一个集群,the and chased
是不一样的集群中?
,它说,每一行是:<簇表示为一个位串><在输入中出现单词的次数> !! –
carla
它甚至意味着什么?簇表示为位串? – alvas
你可以提供一些关于你想要分类的细节吗?在这种情况下,我可以尝试寻找一些参考。否则,可能没有任何一般程序,我想这更多是关于专家知识和/或预定义的措施。 –