我在SAS提供的logistic回归建模过程中遇到下列代码来:SAS倒塌分类变量聚类分析
data dataset(drop=i);
set data;
array mi{*} mi_Ag mi_Inc
mi_WR;
array x{*} Ag Inc WR;
do i=1 to dim(mi);
mi{i}=(x{i}=.);
end;
run;
我需要了解两件事情:
1)有一列一旦这个数据步骤运行,创建标题为“我”。这意味着什么以及为什么会这样。下降“我”基本上放弃它,但如果我不使用下降选项列留在数据集
2.)这一步是用1代替所有缺失的值,并用0休息。在做步骤中没有明确规定需要做什么时发生这种情况。在我眼中,“我i = 1变暗(mi); mi {i} =(x {i} =。);”应该简单地将点放在mi(i)中,无论它在x(i)中找到点。
2部分:
虽然折叠分类变量,下面的代码已经被使用:
proc freq data=example1 noprint;
tables CLUSTER_CODE*TARGET_B/chisq;
output out=out_chi(keep=_pchi_) chisq;
run;
data ex_cutoff;
if _n_=1 then set out_chi;
set ex_cluster;
chisquare=_pchi_*rsquared;
degfree=numberofclusters-1;
logpvalue=logsdf('CHISQ',chisquare,degfree);
run;
什么是Ñ = 1在做什么?还有,为什么我们要创建chisquare = _pchi * rsquared。 pchi已经是chisquare所以与R square相乘的点是什么?
谢谢
P.S.代码来自SAS学习课程之一。希望我可以在这里分享它用于讨论/学习的目的。
谢谢乔 - 非常感谢。所以即时通讯感觉,如果我要测试=,任何时候在做的声明。那么它会像真/假(1/0)测试一样行事? – Freewill
与Do语句无关 - 任何时候它都在赋值(=)的右侧。 – Joe