2014-01-13 100 views
0

我在阅读有关Google Prediction API的内容,但无法找出部分文档。情绪分析Google Prediction API

use cases我被困在这部分有点:

每行只能有一个标签赋予的,但你可以通过重复的例子和应用不同 标签应用多个 标签一个例子到每一个。例如:“兴奋”,“OMG!刚刚有一个神话般的 一天!” “讨厌”,“OMG!刚刚过了一个美妙的一天!”如果你发送鸣叫 到这个模型,你可能会得到这样的分类: “兴奋”:0.6,“烦人”:0.2。

为什么会把“兴奋”:0.6,“烦人”:0.2而没有更多的功能兴奋。为什么兴奋喜欢?

回答

2

这不是标签“兴奋”是首选,而是消息实际上应该被归类为“兴奋”而不是“烦恼”的概率。

假设我有两种情绪分类:“看涨”和“看跌”。然后我在预测API中训练一个模型,即使是“看涨”和“看跌”的训练数据。当我向Prediction API提交消息以获得情绪时,它会根据消息中的字词读取文本并为其分配一个“看涨”和“看跌”概率。概率的总和将加起来为1.

所以再说一次,并不是一个标签比另一个更受欢迎,但消息被“激发”的概率比“恼火”的概率大3倍。

+1

是的,但在上面的例子中,概率不总和为1.这就是我所要求的情况。为什么它为标签分配了6个概率,而两个陈述的内容相同? –

+1

我认为这是一个文档错误。因为你是对的:概率应该加起来为1.在测试我自己的分类模型时,我测试的所有实例都加起来为1。 –

+1

谢谢。这很清楚! –

1

如果你训练的模型只有这两个例子,“兴奋”和“烦人”的标签为句子“OMG!刚刚有一个美妙的一天!”,唯一合理的结果,当查询这样的推文分类“OMG !刚过一个美妙的一天!“应该是“兴奋”:0.5,“烦人”:0.5。

所以可能这种情况在Google文档中没有完全解释。我想他们更关注试图解释说有可能将2个不同的标签与完全相同的句子联系起来。

+1

虽然如此 –