2013-02-14 39 views
2

我是weka中的新成员,我必须从社交网络中提取状态并使用weka分析它们,如何构建包含这些状态的arff文件? weka是否包含词干,停用词和n-gramm的算法,或者我还想使用其他软件来在开始分类之前消除不必要的数据?并为weka为Android和Java的实用工具,有没有在这个软件的使用有所不同...有任何想法的家伙如何为weka创建一个arff文件?

回答

0

你不应该担心您的数据为arff文件,因为Weka的支持其它输入格式。您可以简单地将您的数据作为csv文件并导入到Weka。如果需要,您可以将其从Weka导出为arff

Weka有一个端口可以安卓,你可以download here,我确实在我的项目中没有任何问题地使用它。您可以在PC中训练您的模型并导出它,然后在android see my answer here中使用它作为示例代码。

是,Weka的支持Stemmer algorithms

+0

你能帮我从android文件中提取推文,连接android和weka,并确定将它们放在csv文件中的几个属性,我不知道如何开始...有你的例子或一个关注它的教程 – 2013-02-14 11:54:36

+0

您有构建android应用程序的经验吗?你的培训文件是怎样的?你正在努力达成什么任务? – iTech 2013-02-14 12:10:37

+0

我将描述这个过程,用户必须通过android连接到twitter,他选择一个朋友并提取他的状态,我收集几个状态并将它们放在数据库中或直接放在一个arff或csv文件中,我将weka连接到并通过WEKA通过不同的算法(停用词,词干,n-gramm,原生贝叶斯和svm)对这些状态进行情绪分析,以确定其正面或负面情绪,我该如何开始。谢谢 – 2013-02-14 12:27:45

0

我不知道面书,但你可以通过使用arff文件here至于如何创建它们,网上有数百个教程:查看this one并查看它是否对您有所帮助。

希望这有助于

雷切尔

+0

我假设我会从Twitter获取数据,我是否会使用Android获得的状态,然后把它们在数据的基础上,在那之后,我该怎么处理如何获得它?我可以使用android配置weka,或者在从数据bse中提取后构建arff文件?只是一个问题:)在arff文件中的每个状态末尾写入pos和neg,哪个软件可以给我这些结果,以及在使用weka之前我必须处理哪些算法(词干,停用词,特征) m很困惑,我必须尽快完成这个项目,谢谢你的帮助:) – 2013-02-14 08:59:52

+0

去这个地址它有示例源代码的词干,停用词等请接受我的回答http://massapi.com/ class/weka/core/stemmers/Stemmer.java.html – 2013-02-14 09:04:39

+0

@ManelAyadi悬停在答案旁边,你会看到一个勾号出现。点击它。 – 2013-02-14 09:12:52