2017-04-06 40 views
1

我有一个塔塔数据集是这样的:创建独特的个人ID

HouseholdId PersonId OtherVariables 
1    1 
1    2     
2    1 
2    2 
3    1 
3    2 

这里HouseholdId是每个家庭的唯一标识符,PersonId是每个人在家庭中的唯一标识符。如果我想为样本中的每个人创建一个唯一的个人ID,则为期。我将如何做到这一点?

我试过egen per_id = group(PersonID HouseholdID) 但这似乎并不奏效。

+0

我做了一些编辑,更正了变量名称和一些其他细节中的不一致之处。如果我改变了你的意图,你将需要编辑自己。 –

+0

“似乎不起作用”永远不是一个好问题报告。为什么“显得”?发生了什么?为什么它错了?为什么不是你想要的? –

回答

1

我认为你想要在整个数据集中为每个人提供唯一的标识符。这可能只是

sort HouseholdId PersonId 
gen long obs Id = _n 

如下从一个可访问的讨论​​。这将已经发现打字在Stata

search identifier 

甚至

search id 

(元回答:你可以和应该寻找内的Stata对这样的基本概念信息)

我增加了一个强烈的建议,即这个词的独特仍然带有其仅出现一次的原始含义。这个词截然不同的是,我建议,这是一个更好的词,当这是你的意思。更多关于this paper的第588页。