2016-05-04 30 views
0

我正在研究每天更新列表的服务器。该列表将如下例所示。NodeJS中的模式查找算法

+---+------------+-------------+-------------+-------------+ 
| |  A  |  B  |  C  |  D  | 
+---+------------+-------------+-------------+-------------+ 
| 1 | Name1  |  1  |  2  |  true | 
| 2 | Name2  |  2  |  3  |  true | 
| 3 | Name3  |  1  |  1  |  false | 
+---+------------+-------------+-------------+-------------+ 

在这个例子中我只用2表(除了名),但在现实的列表有15列,每片含其它数目(某些列也可具有相同的值)。

我也有一个最后一列填充值为真或假。此栏将在我收到其他值的第二天填写。

我想要编程的是一种算法,它将能够搜索对于所有行最常见的模式,并且他的值为true。

我想在NodeJS中编程,但不知道我怎么能做到这一点,任何想法?

+0

你想做一些从以前存储的数据派生的算法吗? –

回答

0

考虑到算法是从对应于最后一列为真的各列的先前存储值中导出的。 如果我们考虑像

y=a1*c1+a2*c2...+a14*c14 

各栏目之间的线性关系,其中C1为第1列和A1是coefficient.Then例如,我们“可能”得到这样的一些关系。

y>0.5 then true 
y<0.5 then false 

但言论

  1. 这是否存在列之间的线性关系才会成立。
  2. 这将是模糊聚类,即当您使用上述等式计算真或假时,可能会出现异常值。
  3. 列值之间可能存在一些非线性关系,上述关系中可能没有涉及。
+0

首先感谢您的回答,但我不确定'如果列之间存在线性关系',则表示您的意思。如果你的意思是B列中的值对列C的值有影响,那么没有。并且还有可能循环访问先前的数据,我已经收到(true或false)的最终值并检索最常见模式的列表?像真实行的50%有B1 = 1,C = 3等。 – user3765430

+0

线性关系不在列之间,而是在真/假列和其他列之间。如y = a1 * c1 + a2 * c2 ... an * cn其中c1,c2 ... cn是独立变量,y取决于cx的值。 –