2017-03-30 58 views
-1

我是新来的机器学习领域,我计划使用python作为编程语言来实现算法和Java的系统架构。关于没有Matlab的机器学习工具集的建议

据我所知,机器学习更多的是建立特定于域的数据,可视化数据,并选择合适的模型&参数。实现模型/算法是最后一个相对简单的步骤。

Matlab似乎拥有机器学习的一切,但它太昂贵,需要学习一门新的语言。

除了编程语言,我还需要什么工具来进行企业项目的机器学习?例如数据建模,可视化等

+0

这太宽泛了,可能是针对SO规则的问题。不用担心...很久很久以前,Python在ML方面超过了Matlab(在功耗方面,可能不是易于使用;是的,尤其是因为所有相关库的核心算法都是用Fortran,C,C++编写的;其中许多甚至与Matlab中使用的相同)。我不确定你的系统架构是什么意思,但我相当有信心python也可以代替java。 – sascha

+0

嗨sascha,谢谢你的提醒。我的意思是系统架构是算法实现以外的其他任何东西,比如数据仓库,分布式系统,微服务等。 – Jay

回答

2

经过几年的试验和错误,我建议你直接用python,可能用scikit-learn或tensorflow(如果你想去核心:)。

我也在过去试过R,虽然它是一种非常有效的语言,但它有一些限制:默认情况下它是单线程的,虽然有解决方案,但它们不像Python那样干净。另外,python似乎是机器学习的语言,它很容易学习,而且速度快(取决于当然的解释器实现),也有huuuuuuge支持,很多教程,文档和更多重要的是,图书馆正在积极发展和支持。最后,我建议你考虑Spyder作为数据科学的好IDE,我也尝试过Rodeo,但它并不像Spyder那样成熟稳定。

希望这会有所帮助。

+0

谢谢。数据建模和可视化呢? – Jay

+0

,并为此感到抱歉。我的问题是要求除编程语言之外的工具,工具来帮助可视化数据,选择合适的模型,并测试我的模型。 – Jay

+1

关于数据建模,再次,scikit-learn将会完成大部分工作。添加numpy和熊猫,并完成。根据可视化,matplotlib做到了。此外,scikit-learn还附带了一套很好的指标来评估你的模型有多好(精确,回忆,f1 ...) –