您想按照量级对特征值进行排序,然后选取最高的1或2个值。具有非常小的相对值的特征值可以被认为是排除的。然后,您可以翻译数据值并仅使用前1或2个特征向量来绘制结果的维度。这将给出PCA拆分的视觉表示。另请参阅scikit-learn了解PCA的更多信息。精度,召回,F1分数会告诉你它有多好作品
从http://sebastianraschka.com/Articles/2014_pca_step_by_step.html ...
步骤1:3D举例
“对于我们的简单的例子,我们正在减少的3维特征空间的2维特征空间中,我们结合两个特征向量具有最高特征值来构建我们的d×KD×k维特征向量矩阵WW
matrix_w = np.hstack((eig_pairs[0][1].reshape(3,1),
eig_pairs[1][1].reshape(3,1)))
print('Matrix W:\n', matrix_w)
>>>Matrix W:
[[-0.49210223 -0.64670286]
[-0.47927902 -0.35756937]
[-0.72672348 0.67373552]]"
步骤2:实施例3D
“ 在最后的步骤中,我们使用2×32×3维矩阵WW,我们只是计算经由方程 y以我们的样品变换到新的子空间= W^T×X
transformed = matrix_w.T.dot(all_samples)
assert transformed.shape == (2,40), "The matrix is not 2x40 dimensional."