2012-12-12 69 views
0

我是Apache Mahout的新手,正在处理分类问题。使用mahout对数据进行分类

问题状态: 在文本文件中存在一组数据,我需要根据给定的时间长度从文件中提取部分或全部数据。

时间范围:每条记录都有一个交易日期。
因此,时间跨度将使用逻辑(Sys_Date - Transaction_Date)进行计算。

因此,输出会根据上个月/周/特定天数是否需要数据而有所不同。
如何使用Apache Mahout实现这种过滤。

回答

1

这本身听起来不像机器学习问题。您希望将数据放入某种数据库中,并在日期范围内查询记录。然后,你想用这些数据做些什么。这不是ML工具所做的。

+0

我认为,这是相关的问题。 hadoop,mahout被认为是ML工具。是的,你是对的,它与某些ML算法无关,但它涉及数据预处理,这通常是ML中最耗时的任务 – xhudik

相关问题