2016-11-02 62 views
-1

我正在使用quanteda来创建文本语料库并尝试附加元数据,但我不断收到错误。我之前在另一个数据集上使用过这个代码,但由于某种原因,它不适用于我当前的数据集。该代码是:如何使用quanteda将元数据附加到文本语料库?

dfm.ineq1 <- corpus(df.ineq$speech, 
         docnames=df.ineq$speechID, 
         docvars=select(party)) 

我得到的错误是:

Error in select_(.data, .dots = lazyeval::lazy_dots(...)) : object 'party' not found

我也试图把党在引号和得到这个错误:

Error in UseMethod("select_") : no applicable method for 'select_' applied to an object of class "character"

党柱是相当平直前锋。值为:

"Democratic" "Republican" "N/A"   "Independent" 

关于可能出错的任何想法?

回答

0

我意识到我忘了把数据框放在选择圆括号里!

dfm.ineq1 <- corpus(df.ineq$speech, 
         docnames=df.ineq$speechID, 
         docvars=select(df.ineq, party)) 
1

更简单的方法:使用该corpus构造方法是data.frame对象定义的事实。

dfm.ineq1 <- corpus(df.ineq, text_field = "speech") 

这将自动地正确加载文本字段中speech,并且包括speechIDparty作为docvars。

相关问题