0
我正在使用Staford classifier进行NLP相关任务。但我还需要尝试其他机器学习算法。所以我想将prop文件转换为arff或者打印这些特性,然后转换成一个arff文件。一个主要问题是分类器工具输出的特征具有稀疏表示(仅显示出现的特征)。如何实现这一目标?将prop文件转换为arff文件
我正在使用Staford classifier进行NLP相关任务。但我还需要尝试其他机器学习算法。所以我想将prop文件转换为arff或者打印这些特性,然后转换成一个arff文件。一个主要问题是分类器工具输出的特征具有稀疏表示(仅显示出现的特征)。如何实现这一目标?将prop文件转换为arff文件
在斯坦福分类器中,假设用于为句子生成Ngram,整个句子在第1列给出。那么这些特征将被表示为 '1-set1Ngram1-nextSetNgram1-nextAgain' 等等,直到所有的ngram被形成为止。但我想这个集合中的每一个都以arff格式形成不同的特征,所以格式应该是 '{1 set1Ngram,2 nextSetNram,3 nextAgain}而不是 {1 set1Ngram,1 nextSetNram,1 nextAgain}' –