0
我想将线性表转换为矩阵格式。线性表到矩阵格式
我的输入表看起来是这样的,被称为“linear_table.tab”:
Transcript_1 Transcript_2 Transcript_3 Transcript_4 Transcript_5 Transcript_6 Transcript_7 Transcript_8 Transcript_9 Transcript_10 Transcript_11 Transcript_12 Transcript_13 Transcript_14 Transcript_15 Transcript_16
Transcript_1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
Transcript_2 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0
Transcript_3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Transcript_4 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
Transcript_5 0 0 0 0 0 0 1 0 0 1 0 0 0 1 0 0
Transcript_6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Transcript_7 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
Transcript_8 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Transcript_9 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
Transcript_10 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
Transcript_11 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Transcript_12 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Transcript_13 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Transcript_14 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
Transcript_15 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Transcript_16 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
这里是,使用R我的代码:
transcript ortho
Transcript_1 ORTHO_1
Transcript_2 ORTHO_2
Transcript_3 ORTHO_3
Transcript_4 ORTHO_4
Transcript_5 ORTHO_5
Transcript_6 ORTHO_6
Transcript_7 ORTHO_5
Transcript_8 ORTHO_1
Transcript_9 ORTHO_4
Transcript_10 ORTHO_5
Transcript_11 ORTHO_2
Transcript_12 ORTHO_7
Transcript_13 ORTHO_8
Transcript_14 ORTHO_5
Transcript_15 ORTHO_2
Transcript_16 ORTHO_9
什么,我想我的矩阵表像看:
linear.table <- read.table("linear_table.tab", header=T, sep="\t")
library(reshape2)
dcast(linear.table, transcript~ortho, fill=0)
我得到的R以下的输出:
transcript ORTHO_1 ORTHO_2 ORTHO_3 ORTHO_4 ORTHO_5 ORTHO_6 ORTHO_7 ORTHO_8 ORTHO_9
Transcript_1 ORTHO_1 0 0 0 0 0 0 0 0
Transcript_10 0 0 0 0 ORTHO_5 0 0 0 0
Transcript_11 0 ORTHO_2 0 0 0 0 0 0 0
Transcript_12 0 0 0 0 0 0 ORTHO_7 0 0
Transcript_13 0 0 0 0 0 0 0 ORTHO_8 0
Transcript_14 0 0 0 0 ORTHO_5 0 0 0 0
Transcript_15 0 ORTHO_2 0 0 0 0 0 0 0
Transcript_16 0 0 0 0 0 0 0 0 ORTHO_9
Transcript_2 0 ORTHO_2 0 0 0 0 0 0 0
Transcript_3 0 0 ORTHO_3 0 0 0 0 0 0
Transcript_4 0 0 0 ORTHO_4 0 0 0 0 0
Transcript_5 0 0 0 0 ORTHO_5 0 0 0 0
Transcript_6 0 0 0 0 0 ORTHO_6 0 0 0
Transcript_7 0 0 0 0 ORTHO_5 0 0 0 0
Transcript_8 ORTHO_1 0 0 0 0 0 0 0 0
Transcript_9 0 0 0 ORTHO_4 0 0 0 0 0
我不知道如何在这方面使用R.
这只是创建一个只有0的矩阵。它不包括1. – biobudhan
我有'BEGIN {FS =“\ t”}'这是不必要的,我猜你的数据没有标签。 awk的默认FS是覆盖标签和非标签情况的空白。 –
我刚刚检查了我的数据的制表符空间。它仍然给了我相同的输出。 我跑它使用: 'awk -f ortho.awk linear_table.tab' – biobudhan