2012-05-27 30 views
0

我想自动为我的内容创建标签。会有一个恒定的标签列表,机器人应该创建与它有关的标签。我怎样才能做到这一点?你知道这个课程吗?任何建议,将不胜感激!如何使用PHP自动创建文本标签?

谢谢!

+3

你的问题确实不准确。你有没有你想要做什么的例子?而且,更重要的是,你有什么**尝试过? – Pierre

+2

我还没有看到一个例子,所以我问它是否有人!我被堆积在可能性和制作方式上。这不是一个足够的理由吗?请让你在其他地方进行辩论,这不是正确的地方! – Kemal

+1

看看这第一个http://stackoverflow.com/questions/6039238/how-to-auto-tag-content-algorithms-and-suggestions-needed – HamZa

回答

1

你需要这些标签有多好?

您可以简单地计数n-gram字频率。 例如,通过一些调整,可以创建完美有效的标签以用于博客帖子。

如果你正在寻找更先进的东西,并且你有一个文件语料库,你可以使用TF * IDF(Term frequency,Inverse Document Frequency)。这将显示1文档中提到的有意义的关键字,这是基于它们出现在其他文档中的可能性。如果你的语料库足够大,它会给你很好的结果。

快捷方式可能是标识内容(标题?类别?源?)的相关部分,并改为使用类似此处的内容。

Yahoo has a term extraction API你可能会觉得有趣。