我需要预处理的数据转换为数字,以便能够在数据集中应用ML算法,但有这个功能,它几乎是树形结构与我不知道字符串如何改造。这里去一个例子:机器学习预处理字符串到数字
Feature -> Value I would like to transform to (example):
X Y Z foo -> 0.5
X Y Z bar -> 0.501
A B C foo -> 4.1
W B C foo -> 5
从本质上讲,该字符串转换成一个独特的实数,其中,这个数字将是非常接近其他号码,如果他们的弦几乎相同,该上来的第一句话给予更大的权重首先在String上。
我的问题,是有一个已经存在的算法来解决这个问题?
你问嵌入在1个维空间高维空间。除了大约这通常是不可能的。有关指针的信息,请参阅https://en.wikipedia.org/wiki/Nonlinear_dimensionality_reduction,但您还需要确定您的距离度量标准。 –