0
在我的应用程序中,我使用stanford NLP运行nlp作业。 stanford解析模型被打包在一个jar文件中,并且作为一个UDF格式化,我使用sqlContext.sql来使用它。但我觉得它运行得很慢。任何人都可以帮我加快速度?Spark:stanford-nlp在火花中运行速度太慢
如下代码:
sqlContext.sql("CREATE TEMPORARY FUNCTION segmenter AS 'cn.com.datamesh.stanford.nlp.StanfordNlp'").collect()
sqlContext.sql("SELECT segmenter(text) FROM twitter_data")
你是否成功地以某种方式提高了速度? – Shaido