2014-02-09 33 views
0

我正在开发一个项目,在这个项目中,我希望在网络数据包上实施未受监控的学习来监控新攻击。我计划为此使用K_Means集群。 因此,我已经安装wireshark以捕获数据包。 请帮我确定我可以应用聚类和进一步方法的参数;并确定它是否是一种攻击,例如DDoS攻击!使用K-Means Clustering进行数据包分析的未经学习的学习?

+0

这只是太宽泛而无法在SO上回答。请编辑概述特定问题的问题(如果有的话)。 –

+0

我想基本上使用Wireshark捕获数据包,并分析它们是否属于攻击。我基本上关注DDO攻击。我想知道如何编写一个程序,以便知道它是否是我的网络中发生的攻击 – NEENU

回答

0

无监督聚类会将您的数据包分为K个群组,潜在的攻击数据包会以某种方式脱颖而出,因为它们会具有不同的功能? Kmeans算法通常会迫使您在前面指定K,这可能不是最优的。有一个名为JavaML的库,并且有一个称为cobweb的聚类方法,它将根据数据生成K个簇(它根据您的向量计算出需要制作多少个K)。我的另一个想法是,如果unsup clustering分离数据和攻击数据包实际上最终在它们自己的集群中(通常情况下),那么您可以拿这些数据包并从它们中创建一个分类器(比如bayes或其他) 。通过这种方式,您不必每次都运行群集来获取某些群集,您可以根据从无监督聚类创建的模型进行监督学习,对传入数据包进行分类。

我在非结构化文本的非常大的语料库上做了类似于文件聚类的事情。

HTH