2015-10-13 52 views
-2

我正在研究经济数据,解释有关经济周期的行业行为。对于每个行业我都有30个独立因素。我的Y解释变量是每周股票收益。因素的特点是:适用于多条件变量的机器学习算法?

  • 一些在解释我的Y的短期噪音因此,他们在线性模型体面执行与Y相关,良好。
  • 一些在特定时期有很好的意义,因此它们对于我通过例如卡尔曼滤波估计进行动态估计时的某些月份或年份是有意义的。
  • 最后,通过对空调甚至三倍的空调工作时,似乎有些样品中,realeavant。 (例如,当x1为正数且x2为负数时,Y强烈显着为负数,但在任何其他情况下均不显着)。

我努力以最后一种类型(多个特定变量)的强健方式进行模式化。我考虑使用支持向量机,神经网络或树算法,但我不确定现在是否最好。

我的问题是:什么算法,你会推荐给解释第三类型的现象?你会推荐什么算法(如果有的话)来解释其中的3个?

回答

0

你想要发现特征对和三元组吗?我会用随机森林攻击第三个;这些协会应该在“成功”的树木中表现出密切联系。你也可以尝试减少功能;与其他一两个紧密相关的变量将被支配和移除。

而且,你有没有考虑一个FFT(快速傅立叶变换)来分析观察周期性的噪声?

我不能推荐任何一种算法来解释所有三种现象。首先,你没有给我们任何描述数据的形状和纹理。其次,现有的分析模型几乎可以肯定是过于简单和普遍的,一次就可以进行如此深入的分析。

+0

非常感谢@Prune。我会第一次去随机森林,以配对和三倍调节的方式出来。一旦我做完了,我会尽快回复你。 – ylnor