将prop文件转换为arff文件

我正在使用Staford classifier进行NLP相关任务。但我还需要尝试其他机器学习算法。所以我想将prop文件转换为arff或者打印这些特性，然后转换成一个arff文件。一个主要问题是分类器工具输出的特征具有稀疏表示（仅显示出现的特征）。如何实现这一目标？将prop文件转换为arff文件

来源

2014-01-20 Amrith Krishna

ARFF有一个sparse格式。它与非稀疏ARFF文件非常相似，但值为0的数据未被明确表示。

稀疏ARFF文件具有相同的标题（即@relation和@attribute标记），但数据部分不同。相反，较为了每一个值，像这样的：

@data 
0, X, 0, Y, "class A" 
0, 0, W, 0, "class B"

非零属性明确属性号标识及其价值入账，这样的：

@data 
{1 X, 3 Y, 4 "class A"} 
{2 W, 4 "class B"}

注意this有关arff稀疏格式的问题。

来源

2014-01-20 21:49:31 greeness

在斯坦福分类器中，假设用于为句子生成Ngram，整个句子在第1列给出。那么这些特征将被表示为 '1-set1Ngram1-nextSetNgram1-nextAgain' 等等，直到所有的ngram被形成为止。但我想这个集合中的每一个都以arff格式形成不同的特征，所以格式应该是 '{1 set1Ngram，2 nextSetNram，3 nextAgain}而不是 {1 set1Ngram，1 nextSetNram，1 nextAgain}' –

将prop文件转换为arff文件

回答

相关问题