2017-01-03 111 views
-1

训练数据集寻找药物的机器学习算法:基于诊断

-------------------- 
Patient Age:  25 
Patient Weight:  60 
Diagnosis one:  Fever 
Diagnosis two:  Headache 

    > Medicine:   **Crocin** 

--------------------------------- 
Patient Age:  25 
Patient Weight:  60 
Diagnosis one:  Fever 
Diagnosis two:  no headache 

    > Medicine:   Paracetamol 

---------------------------------- 

给样本数据与规定的患者药物/ medicne设置。

如何根据患者信息(年龄/体重)和诊断(发烧/ headeache /等)找到什么药?

回答

1

您正在瞄准的任务是分类,因为目标值是名义规模。

正确地掌握词汇是至关重要的,因为所有其他工作已经由其他人完成,例如Python的sklearn库,其中包含最相关的算法和大量数据以测试它们并学习算法。

看来你有四个变量作为输入:

  1. 年龄 - 指标变量
  2. 重量 - 度量变量
  3. 诊断一个 - 名义变量
  4. 诊断2 - 名义变量

你将不得不编码你的名义变量,我会推荐一个所有可能的诊断数组为:

发热,头痛,胃痛,X - [0,0,0,0]

现在,如果诊断是正确的和0,否则,每个数组元素将被设置为1。 因此,您总共有2 + n个输入变量,而n是可能症状的数量。

然后,你可以简单地去到sklearn库,并开始用最简单的分类算法:Nearest Neighbour Classification

如果没有产生良好的结果(可能效果会不太好),你就可以开始使用更复杂模型(SVM,RandomForest)。然而,首先你应该学习词汇,并使用简单的模型来了解方法和处理链。