我是数据挖掘的新手,目前正在致力于RapidMiner中TOI的在线新闻文章。我的目标是获得显示文章中提及的最重要内容的结果,或查找隐藏在其中的有价值信息。文本挖掘单个文本文档
我已完成文章“TOI宣言”http://timesofindia.indiatimes.com/home/specials/lok-sabha-elections-2014/news/TOI-manifesto-An-agenda-for-the-new-government/articleshow/31973967.cms的文档处理。 我已经应用了标记,过滤和ngram,并得到了一些结果。
我被困在这里。我不知道如何继续下去。我应该在RapidMiner中使用哪种技术/算法来获得所需的结果?
目前尚不清楚“所需结果”是什么。也许寻找频率最高的单词? – fstab
我正在寻找提供有关文章主要信息的句子。有没有办法做到这一点? – user3501916