0

为了识别活动,我在两个不同设备的步行活动期间收集了加速度计和陀螺仪数据。我有来自两个设备的加速度计数据(x,y和z)和陀螺仪数据(x,y和z),我正试图构建我的特征向量。 enter image description here加速度计在WEKA中缺少数据和分类

我的问题:我的特征向量看起来像如下(:x,y和z注意,我有上百个读数的每一个坐标)的例子

  1. 在某些情况下,我在1st_phone_Gyro和2nd_Phone_Gyro的阅读范例较少,我该如何处理空白空间?如果我知道WEKA抱怨,如果我有这些空单元格,我应该把零填入。零会影响分类吗?
  2. 任何建议什么功能可以提取以改善性能和什么算法会给最佳识别结果?

回答

0

数据中没有太多噪音。因此,您可以通过linear interpolation合理地估计缺失值。如果缺少的值很少,则可以删除这些条目。

由于这里有一定的时间依赖关系,我猜RNN s会给出很好的准确性。一种特殊类型的RNN是LSTM,它具有记忆可变时间段事件的能力。

您还可以尝试“捆绑”大约100个输入以生成一些有用的输入,用于训练标准CNN进行分类。

+0

嗨认识,谢谢你的回答和算法的建议,我会尝试一下。只是为了让你知道,这只是我的数据如何的一个例子。实际上,对于每个坐标(x,y,z),我有数百个读数。 – Timmy