预处理匿名数据以进行预测分析的步骤是什么？

假设我们有一个大型的匿名数据数据集。数据集包含一定数量的变量和观察值。我们可以了解的所有数据都是变量的类型（数字，字符，日期等）。我们可以通过手动查看数据来完成。用于进一步分析的预处理数据集的最佳实践步骤是什么？预处理匿名数据以进行预测分析的步骤是什么？

就比如，让这组数据只是一个表，所以我们并不需要检查表之间的任何关系。

2015-09-21 angubenko

This link给出了一套完整的验证目前在实践中。不过，先从：

希望这是不够好，让你开始...

2015-09-21 20:41:29 displayName

可能我需要更新的问题，以澄清。请参阅更新。 – angubenko

@angubenko：我看不到你的问题有任何更新。 – displayName

对不起，我输入了它 – angubenko

回答