1)我想对Twitter推文进行情绪分析。所以,我选择使用datumbox-framework。我很怀疑我的训练样本的大小应该是多少? &如果我正在收集正面,负面,中性的训练样本,我是否应该为所有训练示例保持相同的大小? (即我可以收集10位,5位,15位中性作为我的训练集,或者我应该在我的训练集中收集并保持相同大小pos = 10; neg = 10; neutral = 10的所有pos,neg,neutral)算法我用于twitter的情绪。 是海军贝叶斯。机器学习训练数据集的大小应该是多少?
2)训练数据集是否有任何大小限制?
我可以知道为什么我的问题已经放弃投票的原因吗? –
它可能已经被低估了,因为它可能导致基于意见的答案。 –