我有一个文本文件有两列(也许它只是标签?)。其中一列的数据如下所示:TC012950_CDS_3428_4122
第一个数字是TC#,第二个CDS,第三个起始位置,第四个结束位置。 其他列有一个值是这样的:11.93631拆分列数据,添加数据,重新合并在一起
我有一个包含由制表分裂染色体信息的另一个文本文件:
ChLG10 protein_coding表达3428 5582。 - 。 TC012950
我的首要目标是最终结合染色体名称(ChLG10)进入第一个文件的列,因此它看起来像: TC012950_ChLG10_3428_4122
与第二列仍包含其原始值。
我已经尝试把数据放入数组或数据框,但然后我很难分裂第一列。我不断收到错误,说更换有0行等。因此,我希望也许有人在这里指出我正确的方向。
如何使用_将第一列分成多列?有没有办法将它们分成多个标签? 之后,我需要将每行与其他数据中的相应行进行匹配,以便我可以将Chr位置列放在TC#和CDS列之间。一旦位于正确的位置,那么我需要将所有列重新合并在一起,并用_分隔。我在想,如果我用tab做了什么,那么我会再用_替换这个选项卡?任何建议或帮助是值得欢迎的。提前感谢你!
有做你的无穷的方法'问,但我们需要一些数据。 – Abdou