我有一个小样本(2k)数据集,其中包含由学生填写的问卷答案,每年抽样两次。并不是所有第一波的在场学生都在第二波,反之亦然。为每个学生创建一个由学校代码,班级代码,学号和波形组成的唯一ID作为小数点。例如100612.1是来自名单10和6,12年级的学生,这是第一波。小数点后面的想法是一种在数据集中再次识别同一个学生的方法(唯一的值小于abs(1)与给定的id是同一个学生在另一个wave上)。至少是理念。找到“几乎”重复数据表中的指数并计算增量
我在想一个脚本,会做以下: - 找到谁的唯一ID的行小于ABS(1)彼此 - 为那些行,生成一个新的行(新表)包括学生ID和测量变量的增量(即波形2中的值 - 波形1中的值)。
我是一个新的R,但我在其他OOP有一点背景。我想创建一个从1到长(df)的for循环,只是寻找它的“兄弟”。我的直觉告诉我,这不是在R中完成任何想法的方式吗? 我所需要的是通过查找第二个波浪行的数据筛选的快速方法。我认为其余的应该从那里直接前进。
感谢您的帮助
PS。因为这是我在这里的第一篇文章,我事前道歉在这篇文章中的任何错误...... :)
切掉小数点,并通过剩余的id(100612) – rawr 2014-12-04 21:23:30