我是Apache Mahout的新手,正在处理分类问题。使用mahout对数据进行分类
问题状态: 在文本文件中存在一组数据,我需要根据给定的时间长度从文件中提取部分或全部数据。
时间范围:每条记录都有一个交易日期。
因此,时间跨度将使用逻辑(Sys_Date - Transaction_Date)进行计算。
因此,输出会根据上个月/周/特定天数是否需要数据而有所不同。
如何使用Apache Mahout实现这种过滤。
我是Apache Mahout的新手,正在处理分类问题。使用mahout对数据进行分类
问题状态: 在文本文件中存在一组数据,我需要根据给定的时间长度从文件中提取部分或全部数据。
时间范围:每条记录都有一个交易日期。
因此,时间跨度将使用逻辑(Sys_Date - Transaction_Date)进行计算。
因此,输出会根据上个月/周/特定天数是否需要数据而有所不同。
如何使用Apache Mahout实现这种过滤。
这本身听起来不像机器学习问题。您希望将数据放入某种数据库中,并在日期范围内查询记录。然后,你想用这些数据做些什么。这不是ML工具所做的。
我还没有正常使用hadoop工作。但在我看来,这段视频应该有所帮助: http://www.youtube.com/watch?v=KwW7bQRykHI&feature=player_embedded
过滤后,您可以在象夫使用的结果(解决叙问题)
我认为,这是相关的问题。 hadoop,mahout被认为是ML工具。是的,你是对的,它与某些ML算法无关,但它涉及数据预处理,这通常是ML中最耗时的任务 – xhudik