使用API来分析一个Twitter流我几乎每个人都得到非常类似的开放性结果。我如何训练一个语料库来生成不同的输出我该如何训练ibm watson个性洞察api?
回答
不幸的是,你不能。另外,由于每条推文只有一小段文字,因此我担心Twitter并不是这种分析的最佳来源。 Watson Personality Insights适用于大型文本样本,并且很可能,twitter语句太短,无法为此类分析提供足够的信息(即使您在同一文本样本中连接了多个推文)。
但是,如果您对其他维度获得有意义的结果,我建议您要做的是忽略开放性信息并尝试使用其他算法(您自己的?)计算它,甚至检查是否删除此维度并不能为您提供足够好的结果。
这里有一些很好的提示 - https://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/doc/personality-insights/science.shtml和一些可以帮助你理解算法内部的论文。
在当前版本中无法训练Watson Personality Insights。但可能有其他选择。
从您的消息来看,如果您收到的个人推文或整个推特流的结果过于相似,我不清楚。在第一种情况下,正如利奥在一个不同的答案中指出的那样,请注意,您应该旨在提供足够的信息,以使分析变得有意义(这是3,000多个单词,而不仅仅是一条推文)。在第二种情况下,如果您的分数与如此之多的文本(每个用户有多少推文?)仍然如此相似,我会感到有些惊讶,但这可能仍会发生,具体取决于域。
如果您正在分析单独的推文,您可能也会从用户Tone Analyzer(以今天的Beta版本)获益。它的“社交基调”与Personality Insights基本相同,即使对于小文本也提供一些原始分数。 (顺便说一下,你还可以采取其他措施,如情绪和写作风格)。
无论如何(小型或大型输入),我们鼓励用户在他们自己的数据语料库中查看原始分数。例如,假设你正在分析一系列IT支持电话(我正在做这件事),你可能会发现一些特质倾向于完全相同,因为它们的行话和写作风格都是相似的。但是,在之内,您的域名可能存在细微差异,您可能需要关注,即。仍然有90%的百分位数,每种性状中最低的10%......因此,您可能需要在音调分析仪(api reference)中对人格洞察raw_score
(api reference)或只是score
进行数据分析并得出自己的结论。
- 1. IBM Watson个性洞察演示编辑问题
- 2. IBM Watson针对不同语言的个性洞察力?
- 3. IBM Watson对话培训状态API
- 4. IBM Watson检索和排名:Ranker训练失败
- 5. 训练自己的分类器IBM Watson Visual Recognition Unity3d
- 6. IBM Watson Alchemy API VerifyError
- 7. IBM Bluemix IoT实时洞察
- 8. IBM存在洞察RpiProx
- 9. IBM Watson nl-c培训时间
- 10. 如何使用Watson AlchemyAPI培训API?
- 11. Xamarin洞察web api
- 12. IBM Watson使用Alchemy API
- 13. IBM Watson视觉识别在Unity3d中训练自己的分类器
- 14. IBM Watson语言翻译 - 使用平行语料库训练的正确方法
- 15. watson概念洞察api - 如何获得概念的向量表示?
- 16. Facebook洞察图API,永久性令牌?
- 17. 如何使用图表API洞察(JavaScript)
- 18. Facebook图形API洞察
- 19. 当根据训练集训练分类器时,如果某些训练样本比其他训练样本更值钱(更有价值),我该怎么办?
- 20. 通过Api进行洞察
- 21. Spring框架自我训练
- 22. Facebook广告洞察api
- 23. 我应该如何训练布朗语料库上的gensim
- 24. 使用API训练和重新训练斯坦福标记器
- 25. IBM Watson Knowledge Studio
- 26. IBM Bluemix - Java-Watson
- 27. IBM Watson Dialog Concept
- 28. IBM Watson订阅
- 29. IBM Watson Retrieve&Rank
- 30. 如何训练直链CRF?