outliers

    2热度

    1回答

    我有一个数据帧,假设这样的: names<-c("a","a","a","a","a","b","b","b","b","b","c","c","c","c","c","c","c","c") var1<-c(0.942999593,0.935507266,0.973589623,0.969415912,0.95230801,0.935507266,0.888740961,0.91750551,

    1热度

    1回答

    我正试图找到最准确的函数来给我一个数据集内给定值的分位数。数据集将(可能)始终是指数分布。 我使用的方法如下(我道歉,如果编码很差,因为我真的基础设施的人,而不是一个统计的家伙,也不是每天DEV): import sys, scipy, numpy from matplotlib import pyplot from scipy.stats.mstats import mquantiles

    2热度

    3回答

    我有一个double值的列表,我想在其中找到异常值。 Weka是否提供了解决问题的算法?

    1热度

    1回答

    我想在MATLAB中使用使用LibSVM的单类分类。 我想训练数据,并使用交叉验证,但我不知道我必须做的标记异常值。 如果例如我有这样的数据: trainData = [1,1,1; 1,1,2; 1,1,1.5; 1,1.5,1; 20,2,3; 2,20,2; 2,20,5; 20,2,2]; labelTrainData = [-1 -1 -1 -1 0 0 0 0]; (前四个是1类

    1热度

    1回答

    我试图使用Weka下的LibSVM的包装来获取单类分类器的最佳参数。 出于这个原因,我要weka.classifiers.meta.GridSearch,然后我选择LIBSVM一个类。 我正在使用的所有数据都标记为同一类。我想找到的参数是NU和伽马 的gridSearch选项有: weka.classifiers.meta.GridSearch -E CC -y属性classifier.kerne

    0热度

    1回答

    使用8.3版本(在这件事上没有选择)。 我不能使用“; WITH x AS”样式查询,因为这不被支持(从我在8.3中可以知道的,我试图使用它们并且它们不被识别)。我当然也不能使用TOP,因为我不在SQL Server中。我试着用下面的限制查询,但通过下面的错误阻碍: SELECT * FROM myView LIMIT(SELECT (COUNT(int_field) * 0.95)::integ

    0热度

    1回答

    我正尝试使用ELKI进行异常值检测;我有我的自定义距离矩阵,我试图将它输入到ELKI以执行LOF(例如,第一次)。 我尝试关注http://elki.dbs.ifi.lmu.de/wiki/HowTo/PrecomputedDistances,但这并不是很清楚。我做什么: 我不希望加载从数据库中的数据,所以我使用: -dbc DBIDRangeDatabaseConnection -idgen.c

    0热度

    1回答

    我想构建一个循环闭包算法,但在开始开发之前,我想测试哪个特征描述符在真实数据集上更好地工作。 我有一对双向走廊的图像,一个进入房间,另一个离开同一个房间。所以它们代表相同的场景,但是来自两个不同(相反)的观点。 我使用的是OpenCV,我已经为探测器,提取器和匹配器编写了部分代码。 但现在看结果我发现有很多错误匹配。 我该如何放下它们? 我试图使用cv :: FindFoundamentalMat

    3热度

    1回答

    我有载体的这个列表: tdatm.sp=structure(list(X3CO = c(24.88993835, 25.02366257, 24.90308762 ), X3CS = c(25.70629883, 25.26747704, 25.1953907), X3CD = c(26.95723343, 26.84725571, 26.2314415), X3CSD = c(36.9525

    3热度

    2回答

    我正在处理一个分类问题,我只有一个类的数据,所以我想在“目标”类与其他所有可能性“离群”类之间进行分类。因此,我打算使用单类分类器或LibSVM分类器。但问题在于: 我需要提供“异常值”类的培训数据吗?如果是的话,有什么方法可以解决这个问题,因为我只有关于Target类的数据。