0
SVM是一种几何算法,它试图通过在两个类之间绘制一个超平面来最大化两个类之间的边距。数字作为数据点是可以理解的。但是,我不明白当数据是文本时如何确定边距和超平面?如果有人能够举一个关于SVM如何处理文本的例子,我将不胜感激。SVM如何用文本数据确定边距?
SVM是一种几何算法,它试图通过在两个类之间绘制一个超平面来最大化两个类之间的边距。数字作为数据点是可以理解的。但是,我不明白当数据是文本时如何确定边距和超平面?如果有人能够举一个关于SVM如何处理文本的例子,我将不胜感激。SVM如何用文本数据确定边距?
通常在机器学习中,文本输入被转换为文本数据和对应数值的字典。假设你的语料库中有三个词:苹果,橘子,香蕉。字典可能看起来像
苹果:1
橙子:2
香蕉:3
所以你通过1,2,3到您的模型和数值转换回文本数据时你会得到你的结果。例如,如果你得到2的结果,它意味着橙子。
大多数机器学习算法只适用于数字。所以你的文本以某种方式转换为数字表示,然后处理。 –