2010-08-15 76 views
-2

首先,我需要从我的帖子的标题和描述以编程方式获取标签(不同于在此完成的在stackoverflow上)。我不想让常用词出现在关键词中。有没有这样做的有效方式?编程从标题,描述和相关项目获取标签(关键字)

获得好标签后,我想将它们保存在MySQL DB中。

现在,我如何高效使用这些自动创建的标签获取相关的帖子?例如。这里做了什么。

+0

我需要提供代码,即时通讯只是试图处理一个算法...什么是-1。该死的 – 2010-08-15 01:58:05

+4

你的问题非常含糊。例如,您不指明您正在使用的是哪种应用程序。没有一些细节,像“标签”,“帖子”,“关键字”这样的词汇毫无意义。 – 2010-08-15 02:05:26

+0

@Jeff,我可能不是一个标签专家....这就是为什么我首先要问这个问题。这样我的会员就不会被迫输入标签 – 2010-08-15 02:11:40

回答

4

查找tf-idf。您正在寻找高tf-idf分数的术语。

+0

@Getr G,哇,看起来很复杂,但似乎是最好的方式。任何更简单的方法来做到这一点?这是怎么做到这一点在stackoverflow?你知道吗? – 2010-08-15 02:07:21

+1

@Sir:它是在SO上手动完成的。就像你问这个问题时你是怎么做的,以及当我刚刚从你的问题中删除了两个假标签时的过程。 – Shog9 2010-08-16 05:02:42

+0

@ Shog9我明白了!!!!!!!!!!!!!!!你晚了! – 2010-08-16 05:27:25

2

我会建议不要使用这种方法。您可以使用它来建议标签,但自动标签将非常非常难以正确和准确地实现。

其中一个原因是因为计算机不理解语义。在这里采取任何问题,并尝试这样做。 95%的时间无法工作。

+0

好吧,我明白了。将不得不忘记该功能 – 2010-08-15 02:14:32

1

我不明白如果没有某种列表,这将是怎么可能的。您的应用程序如何知道要使用哪些单词而不使用?我想你可以找到一个你可以API调用的theauau,并使用它来查找标签,如果你希望这样做是出于搜索引擎优化的原因,它会变得相当复杂,你可以让该应用根据关键字列表查找单词,如从谷歌关键字工具获得的一个..

至于如何做到这一点,我一直在使用PHP,并认为它非常适合构建web应用程序,但对于这类事情(处理很多正则表达式等)我倾向于在PHP中遇到问题,也许它只是我,但我更喜欢使用perl

相关问题