2014-03-07 23 views
0

正在开发正在输入文本,并输出与在字中给出这取决于它们的情绪的数值句子和单词作为行和列的矢量(文档)程序。功能性词语(例如,was,were)将被赋予0.01的值。这个程序背后有一个数据库,其中单词的数值取决于它们的正负极性。这个数据库会给这个词提供一个先前的极性,这个极性可能会根据其上下文的极性而改变。要解决的问题是数据库中的单词的数值范围。用什么样的数值来给一个词赋予情感分数?

+1

我想你应该用一下你的数据集,并手动微调您的算法来找出这个范围 – Leo

+0

我利奥同意:选择基于直觉的初始设置和实际数据进来开始微调。 – nablex

回答

0

我的意思是,如果你已经设置基本的话.01你为什么不干脆放弃的话基于长度的点值。困难的部分将摆脱所有常见的话。

1

我认为要考虑一下原始方法是看,你可能有(约)最大的话,并且你想有两个数值之间的差。/0.01 = 2/0.01 = 200个字 - 例如用打算从-1到1和0.01的分辨率的范围可以最多((-1)1)有。我希望你明白这一点。

所以有1000个积极的话,用你的0.01范围的数值分辨率500个否定词的集合必须是 - (500 * 0.01)至(1000 * 0.01)= -5〜10

我希望我能正确理解你的问题。

一个忠告:在使用double/float记住,数值计算精度有限的使用,例如,0.01将无法精确保存为0.01,所以你绝不能使用==在你的代码进行比较,就必须是> =或< =,你可能需要调整你的逻辑有时会实现这一目标。

相关问题