2011-12-21 47 views
1

我是数据挖掘的新手。我在做我的B.Tech最后一年,我的最后一年的项目标题是“使用文本挖掘从学生反馈中提取和分析教师管理学科的表现”。在这里,我们将有一些包含学生反馈的文件,每个学生将有一个文件。从所有这些文件中,我们必须检索有用的信息。需要关于文本挖掘的想法,以从大量文件中挖掘数据

任何人都可以告诉我如何开始,有什么工具可以使用? 有什么技术可以使用? 我熟悉JAVA(jse),我可以用java编程语言实现这个,怎么样?

问候...... Upendra.S

回答

3

一些想法:

  • 这是最常用的单词或短语?
  • 哪些词经常共同出现(关联分析)的学生成绩
  • 词/短语频率(这词做顶部和底部的学生在教授的评论使用?)通过教师的评价
  • 词/短语频率(哪些词与学生给予教员比分
  • 词/短语频率由教师任职有关(?)这词与新旧PROFS关联?)

这里是我的五个部分组成的系列上快速采矿文本挖掘:

http://vancouverdata.blogspot.com/2010/11/text-analytics-with-rapidminer-loading.html

0

在我看来,你可以通过这些话题。它帮助了我的一个项目。

工具 - Matlab TMG tool

使用的算法 - 潜在语义分析。 (LSA Example

数学概念 - 奇异值分解。 (SVD