outliers

    -1热度

    1回答

    我的数据框在每个列/变量中有许多异常值。我使用Boxplot/IQR截断值将它们移除了75%/ 25%。我拿出每一列,并从中删除异常值。因此,每列中都有不同数量的值。现在我想将那些没有任何离群值的所有NEW变量组合到单个数据帧中。数据框中出现此错误。我该如何解决这个问题?因为,我必须在新数据框上进行逻辑回归。我尝试了cbind.data.frame,然后与rbind类似,但这并不能解决问题。 下面

    0热度

    2回答

    的离群值数据集的异常值可以通过单连接方法轻松识别。现在我想自动删除异常值。我的想法是删除超过指定距离值的数据。这里是我的代码以mtcars的示例数据: library(cluster) library(dendextend) cluster<-agnes(mtcars,stand=FALSE,method="single") dend = as.dendrogram(cluster) 在

    0热度

    1回答

    我已经在回归模型上运行了OutlierTest并将其分配给了一个变量。该表的class也是outlierTest。我想从该表中提取行索引。 我无法将表格转换为data.frame或matrix。 > library(car) > b <- outlierTest(fit_train2) > b rstudent unadjusted p-value Bonferonni p 4

    -1热度

    1回答

    什么是从熊猫数据框中移除异常值的有效方法? 我有一个熊猫数据框,我需要从数据框中删除异常点。 X1 X2 X3 X4 228.0 4474.91836735 3507.15151515 6625.0 77.0 468.0 582.0 549.0 160.0 9.0 3507.15151515 6625.0 36.0 250.0 3507.15151515 6

    2热度

    1回答

    替换中的所有列的离群值我有3列的数据帧,用于离 c1,c2,c3 10000,1,2 1,3,4 2,5,6 3,1,122 4,3,4 5,5,6 6,155,6 我想要替换异常值在所有这些是外2西格玛的列。使用下面的代码,我可以创建一个没有异常值的数据框。 df[df.apply(lambda x: np.abs(x - x.mean())/x.std() < 2).all(

    0热度

    1回答

    我正在使用DBSCAN对数据集执行聚类。我认为这是因为在plt.plot()中传递给markerfacecolor的颜色参数不是单个值。请让我知道如果我在这里错了。我的功能是纬度,经度,speed_mph,speedlimit_mph,vehicle_id,driver_id。 这里是我的集群代码 dbsc = DBSCAN(eps = .5, min_samples = 5).fit(df_co

    1热度

    1回答

    我有一个数据框和数字和字符串列。 import numpy as np import pandas as pd from scipy.stats import zscore data = {'c1' : [1., 2., 3., 4.], 'c2' : [4., 3., 2., 1.], 'c3' : [5., 6., 7000., 8.], 'c4' : [8., 7., 6

    0热度

    1回答

    我对R非常陌生,正试图从一个子集中移除异常值以改善GLM。我使用的代码是: data$sel <- ifelse(data$chol==8.3 & data$whr==1.14 ,(0), (1)) data dim(data) data2 <- subset(data, !(chol==8.3 & whr==1.14)) dim(data2) 我这样做,但是,当我试图绘制新的数据图表

    0热度

    1回答

    我有一个用于快速傅立叶变换信号的DataFrame。 有一列频率为Hz,另一列为相应的幅度。 我读过几年前发布的一篇文章,您可以使用简单的布尔函数来排除或仅包含最终数据框中高于或低于几个标准偏差的异常值。 df = pd.DataFrame({'Data':np.random.normal(size=200)}) # example dataset of normally distributed

    0热度

    1回答

    我在OBIEE 12C创建的表是这样的: 现在我想以红色是高于平均值的2个标准偏差值的颜色。 我想为每行的每个值(例如A,a1,a1.1)做这件事。 预先感谢您的帮助, 安德烈