regression

    0热度

    1回答

    我试图解决输入特征集大小约为54的回归问题。 对单个预测变量'X1'使用OLS线性回归,我无法解释Y中的变化 - 因此我试图使用回归森林(即随机森林回归)来查找其他重要特征。后来发现选定的'X1'是最重要的特征。 我的数据集有〜14500个条目。我已经将它按比例9:1分成了训练和测试集。 我有以下问题: 试图找到重要的功能时,我应该运行在整个数据集的回归森林,或只在训练数据? 一旦发现重要特征,应

    2热度

    1回答

    喂我目前工作的一个回归分析用下面的代码: for (i in 1:ncol(Ret1)){ r2.out[i]=summary(lm(Ret1[,1]~Ret1[,i]))$r.squared } r2.out 此代码运行每个列的简单OLS回归在数据帧agianst第一列并提供这些回归的R^2。 在时刻处,回归使用列中的所有数据点。 我需要现在是代码,而不是使用列中的所有数据点只

    -1热度

    1回答

    我创建了这种有8个变量的数据库,我有400行这样的。我的因变量是20个地区所有运费的总和。 w_o,v_o和u_d是该地区的人口,gdp和公里的公路。 fulldata = cbind(matrix(a,400,1),orig, dest, matrix(distanz,400,1)) fulldata dep u_o v_o w_o u_d v_d w_d dist

    0热度

    1回答

    我正在分析Iris dataset并在花瓣宽度和花瓣长度之间做了散点图。为了使情节我用这个代码: # First, we'll import pandas, a data processing and CSV file I/O library import pandas as pd # We'll also import seaborn, a Python graphing library

    2热度

    1回答

    看起来在最新版本的熊猫中,所有的ols功能都已被弃用(pandas.stats已被删除,并且没有PanelOLS或ols函数) 。我正在尝试使用statsmodels运行面板回归,但找不到有效的方式来执行此操作?以前我可以用这样的代码: panel_ols = ols(y=DataFrame, x=DataFrame, ...,) 这估计使用一个单一的面板回归中的所有数据系数。 现在有办法做到

    2热度

    1回答

    我有一个包含1700万观察值的数据集,我试图用它来训练DNNRegressor模型。但是,培训根本不起作用。损失大约10^15,这真是令人震惊。我已经尝试了几个星期的不同事情,无论我做什么,我都无法承受损失。 例如,训练后我进行测试predition与用于训练数据相同的观察结果中的一个。预期的结果是140944.00,但预测产品-169532.5,这是很荒谬的。训练数据中甚至没有任何负面的价值,我

    -1热度

    1回答

    我使用带有固定效果''内'选项'的'plm'命令来运行我的面板回归。 因变量是数字,而所有自变量都是分类的或二元的,除了cgi,eui,sjump和rv。 三个二元变量cc,ce,cw应该代表4个类别的同一个分类变量,所以我排除了一个。 但是,当我尝试从这三个代表4个类别的二元变量中分析第四个类别的效果时,由于此固定效果模型没有给出可用于获得此效果的截距第四个分类变量,我必须设置所有的零。 我可以

    1热度

    1回答

    我想执行回归,但我需要命令中的条件/约束,但我的工作不起作用。我的因变量是COMP_STD,我的独立变量是BGroup。 BGroup具有以下值:12345。 我想运行5个不同的回归与变量BGroup,所以这个变量等于1,2等等。这是我试过的语法: regress COMP_STD if inrange (BGroup, 1) 但塔塔说inrange not found所以我想那一定是我无法找

    1热度

    1回答

    我有2个关于estat vif问题来测试多重: 它是正确的,你只能在回归命令后计算estat vif? 如果我执行此命令,Stata只给我一个自变量的vif。 如何获得所有自变量的vif?

    0热度

    1回答

    我有一个看起来像这样的数据: height <- c(1,2,3,4,2,4,6,8) weight <- c(12,13,14,15,22,23,24,25) type <- c("Wheat","Wheat","Wheat","Wheat","Rice","Rice","Rice","Rice") set <- c(1,1,1,1,2,2,2,2) dat <- data.frame(