我正尝试使用生存包中的Surv
和survfit
函数来运行生存分析。我的大部分数据都被截断,我不确定是否将它输入到Surv
函数中。我的反应变量是从桥梁被分类为不足时开始到崩溃结束时的时间(以年为单位)。我可以追溯从2012年到2012年的每座桥梁的不足状况,但没有更多。审查发生是因为许多桥梁从倒塌到1992年被归类为不足之处,因此我不知道它们何时变得不足,因此我不知道它们的真实“寿命”(从缺陷分类崩溃)。例如说,一个 桥塌了于1995年,被列为1995年,1994年,1993年为不足,1992年,是可能的,它是第一个列为1992年为不足,这是 也有可能是已经分类自1984年以来一直不足。因此,我认为我的审查被认为是截断的。如何使用左截断数据的R中的“生存”包和Surv函数?
一些示例数据:
Year0 = c(1992, 1992, 1999, 1992, 1993, 2007, 2005, 1992) # The years when each bridge was first observed as being deficient.
Year1 = c(1993, 1994, 2002, 1996, 2004, 2012, 2011, 2000) # The years in which each bridge collapsed
Defyears = Year1 - Year0 + 1 # The number of years for wich I can observe each bridge being deficient
time1 = Year0 - 1992 # Since I want the time scale to be from 0 to 21 instead of 1992 - 2012, I subtract 1992 from each time observation.
# This now becomes the beginning point for the lifetime of each bridge.
time2 = Defyears + time1 # This is the ending point of the lifetime of each bridge.
n = length(time2)
注意,四出于八个桥的是左截断,桥1,2,4和8。我 可以不完全观察时,被第一分类为缺陷。对于桥梁 3,5,6和7,我知道它们的确切寿命,因为它们在1992年之后变得不足,因此这些观察结果没有被审查。
我再适合以下型号:
bridges = survfit(Surv(time = time1, time2 = time2, event = rep(1,n)) ~ 1) # I do "event = rep(1,n)" because each bridge collapsed.
我只是不知道,这个模型是正确的。首先,在文档中, 表示“时间”用于右删失数据或间隔删失数据的开始时间。另一方面,我不明白这个模型如何解释未被审查的观察结果。任何人都可以告诉我,如果这是正确的,如果没有,我需要改变以及为什么。 任何帮助,不胜感激。非常感谢!
这里需要的是没有崩溃的桥梁上的数据。 –