2017-10-10 58 views
0

我试图在R约40000行的数据集上运行stemmer函数(通过data.table包上传),但它需要永久运行。我的代码如下所示:R中的Stemmer函数慢

data[, Description := map(Description, function(k) stemmer(k))] 

如果手动停止的过程中,它显示超过50级的警告为: Image Link

是否有更快的运行它的替代品。我的电脑有8Gb内存。

+0

词干一般需要很长的时间,你检查的时间差为办刊说10点的记录? –

+0

是的,它在10行上运行速度更快,但替代方案是什么,我如何处理整个数据? –

+0

尝试批量运行,stemmer确实需要花费大量时间来使用大型数据集。你试过了吗? –

回答

0

使用lapply,你的函数将运行得更快