2017-10-28 49 views
0

我有这样的保险索赔从一个特定的疾病D.与多元的历史数据预测保险理赔

遭受被诊断患有疾病d后患者的数据,让患者索赔各种治疗。对于每项索赔,都有关于提出诊断索赔后的天数,索赔金额以及一些其他分类变量的数据。

使用这些数据,我必须预测每位患者在未来12个月内将要求多少钱。

我没有太多的时间序列预测经验,所以我不知道该怎么做。我所看到的所有教程都有数据集,每个数据行都有日期。

您能否推荐使用哪种建模技术以及如何使用我的数据?

样本数据的图像

enter image description here

回答

0

既然你想预测多少你多少每位患者将在未来12个月要求,我认为最好的选择将是一个泊松回归而不是时间序列分析。

首先你的依赖值(y)是“2个月内患者的索赔”。这里,响应变量是count。

现在,你必须弄清楚影响你的依赖(y)的因素是什么(独立值x)。

你的一些数据是分类的。因此,如果您正在应用回归技术,最合适的就是泊松回归模型。