我该如何训练ibm watson个性洞察api？

使用API来分析一个Twitter流我几乎每个人都得到非常类似的开放性结果。我如何训练一个语料库来生成不同的输出我该如何训练ibm watson个性洞察api？

2016-03-04 Tope Alabi

不幸的是，你不能。另外，由于每条推文只有一小段文字，因此我担心Twitter并不是这种分析的最佳来源。 Watson Personality Insights适用于大型文本样本，并且很可能，twitter语句太短，无法为此类分析提供足够的信息（即使您在同一文本样本中连接了多个推文）。

但是，如果您对其他维度获得有意义的结果，我建议您要做的是忽略开放性信息并尝试使用其他算法（您自己的？）计算它，甚至检查是否删除此维度并不能为您提供足够好的结果。

这里有一些很好的提示 - https://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/doc/personality-insights/science.shtml和一些可以帮助你理解算法内部的论文。

来源

2016-03-04 21:40:24 Leo

在当前版本中无法训练Watson Personality Insights。但可能有其他选择。

从您的消息来看，如果您收到的个人推文或整个推特流的结果过于相似，我不清楚。在第一种情况下，正如利奥在一个不同的答案中指出的那样，请注意，您应该旨在提供足够的信息，以使分析变得有意义（这是3,000多个单词，而不仅仅是一条推文）。在第二种情况下，如果您的分数与如此之多的文本（每个用户有多少推文？）仍然如此相似，我会感到有些惊讶，但这可能仍会发生，具体取决于域。

如果您正在分析单独的推文，您可能也会从用户Tone Analyzer（以今天的Beta版本）获益。它的“社交基调”与Personality Insights基本相同，即使对于小文本也提供一些原始分数。（顺便说一下，你还可以采取其他措施，如情绪和写作风格）。

无论如何（小型或大型输入），我们鼓励用户在他们自己的数据语料库中查看原始分数。例如，假设你正在分析一系列IT支持电话（我正在做这件事），你可能会发现一些特质倾向于完全相同，因为它们的行话和写作风格都是相似的。但是，在之内，您的域名可能存在细微差异，您可能需要关注，即。仍然有90％的百分位数，每种性状中最低的10％......因此，您可能需要在音调分析仪（api reference）中对人格洞察raw_score（api reference）或只是score进行数据分析并得出自己的结论。

来源

2016-03-07 20:04:12 herchu

我该如何训练ibm watson个性洞察api？

回答

相关问题