-1

假设我有200人(行)的样本及其个人信息(教育,性别,职业等)。是否有可能通过任何算法创建基于我原始样本200的人造2000样本?如果是的话,是什么和如何? 遗传算法来在脑海里,如何从真实人群中扩大样本量

+1

对于[交叉验证](https://stats.stackexchange.com),这是一个更合适的问题,但有很多方法可以这样做。过采样是最直接的,但如果你想创建与现有不同的新观测数据,你可以看看SMOTE。 – Tchotchke

+1

我投票结束这个问题作为题外话,因为更高一级的统计问题属于[交叉验证](https://stats.stackexchange.com/) – Prune

回答

0

不知道你的问题的目的,可以使用“采样”,如果你想:

1.Estimating样本统计的精确性(中位数,方差,百分位数)通过使用可用数据的子集(jackknifing)或从一组数据点中随机抽取(bootstrapping)

2.在执行重要性测试(置换测试,也称精确测试,随机化测试,或重新随机化测试)

3.通过使用随机子集(引导,交叉验证)来验证模型 常用的重新采样技术包括自举,折叠和排列测试。

相关问题