0
A
回答
0
我相信你所指的过程是one-hot encoding。您首先需要使用的宽度3.滑动窗口在这里看到你的DNA序列转变成3BP字序列:Generate a list of strings with a sliding window using itertools, yield, and iter() in Python 2.7.1?
所以,你应该有类似的DNA“字”列表(例如['aaa', 'tgc']
)然后你会想要将每个单词转换成一个向量。做到这一点的一种方法是创建一个字典,其中包含所有可能的单词和值的关键字,并带有单表示形式。然后,您可以使用列表理解和字典查找,简单地将每个单词转换为其相应的向量。这可能不是最有效的方式,但这是一个开始。 sklearn有OneHotEncoder,但它只适用于整数。请参见https://machinelearningmastery.com/how-to-one-hot-encode-sequence-data-in-python/
相关问题
- 1. DNA序列操作
- 2. 计算DNA序列
- 3. 查找DNA序列的互补序列
- 4. 特征散列
- 5. Tensorflow-特征列
- 6. 混乱游戏DNA序列
- 7. DNA与蛋白质序列
- 8. 如何排序独特的特征::矢量的特征::矢量?
- 9. Play 2.1 Json序列化特征
- 10. Upickle密封特征的序列化/反序列化
- 11. 拆分的DNA序列与d
- 12. 对齐Python中的DNA序列
- 13. 按特征值排序特征向量(相关排序)
- 14. Python:如何使用二进制值编码DNA序列?
- 15. LibSVM特征向量中的特征顺序是否重要?
- 16. 网格上的排序特征值和特征向量
- 17. 带有bagof特征的SIFT特征
- 18. cvBlobsLib的特征向量和特征值
- 19. cvBlobsLib的特征向量和特征值
- 20. 表征轨迹的特征
- 21. 二进制特征的组合(向量)
- 22. DNA配对,阵列
- 23. 红宝石突变DNA序列
- 24. 用蟒/ biopython计数DNA序列
- 25. 将DNA序列转换为氨基酸
- 26. 计算较大DNA序列中模糊序列的出现
- 27. python numpy排序特征值
- 28. 特征
- 29. ObjectiveC:按特定顺序读取特征
- 30. BLE更改要写入的UUID特征