我有一个凌乱的数据集,其中包含姓氏,名字,地址(按此顺序)在一个变量中,而我需要这是2个不同的名称和地址。 我试图SAS将长整型字符变量分成两个变量
data commainvest (keep=appln_id person_id person_name lastname firstnames newname address);
set commainvest;
lastname=scan(person_name,1,',') ;
firstnames=scan(person_name,2,',') ;
newname=catx(', ',lastname,firstnames) ;
address=substr(person_name,1,length(person_name)-length(newname)) ;
run;
其他如
address= substr(person_name,-1,length(person_name)-length(newname)) ;
或
address= scan(person_name,3,length(person_name)) ;
但它总是错误地削减地址部分或离开最后一列的所有信息。 实际上也没有必要削减最后名字和姓氏,但我可以找到一种方法将它们从一开始就放在一起。我的数据之间用逗号分隔。 我感谢你的帮助 感谢 安娜
你能展示一个你的数据的例子吗? –
如果我能看到一行数据 –