我有我需要创建一个分类模型关系数据库的庞大数据集。通常对于这种情况我会使用ILP,但由于特殊情况我不能这样做。关系数据挖掘,而不ILP
解决这个问题的另一种方法是试图在我有外部关系时汇总这些值,但是对于某些名义属性,我有数以千计的重要且不同的行(例如:与几种不同药物有关的患者处方),在这种情况下,我无法为那个名义属性的每一个不同的行创建一个新的属性,而且如果我这样做的话,大多数新列都会有NULL值。
是否有任何非ILP算法,可以让我的数据挖掘关系数据库而不诉诸于技术像旋转这将创造数千个新的列?
您可能在http://datascience.stackexchange.com/上有更多运气。 – fxm
然后将检查它 – user3644986