2014-11-04 35 views
0

我有一个ARRF文件,该文件是这样处理%符号的字符串属性在秧鸡

@relation training_set 
@attribute URL string 
@attribute DOI numeric 
@attribute ISBN numeric 
@attribute Conclusions numeric 

@attribute Source_Type {Scientific, Non_Scientific} 
@data 
http://www.nejm.org/doi/full/10.1056/nejmra1002842 , 0 , 0 , 1 , 0 , Scientific 
http://www.plosone.org/article/info%3adoi%2f10.1371%2fjournal.pone.0014270#pone-0014270-t003 , 1 , 0 , 1 , 0 , Scientific 

我有装载问题这个文件WEKA因为我在URL数据是“%”符号。我知道%被视为weka中的评论,但是有没有办法获取这种类型的字符串?我没有将URL作为名义数据,因为它是训练集中的标识符?

回答

0

通过包装在单引号括起来的,我能成功加载文件到Weka的(我还添加了另一个属性来匹配数据的结构):

@relation training_set 
@attribute URL string 
@attribute DOI numeric 
@attribute ISBN numeric 
@attribute Conclusions numeric 
@attribute Binary numeric 
@attribute Source_Type {Scientific, Non_Scientific} 
@data 
'http://www.nejm.org/doi/full/10.1056/nejmra1002842' , 0 , 0 , 1 , 0 , Scientific 
'http://www.plosone.org/article/info%3adoi%2f10.1371%2fjournal.pone.0014270#pone-0014270-t003' , 1 , 0 , 1 , 0 , Scientific 

希望这有助于!