我努力尝试将来自两个文件的部分匹配字符串组合在一起。合并部分匹配的字符串
文件1包含一个唯一字符串列表。这些字符串部分匹配的数量在文件2串如何合并文件1行与文件2每个匹配的情况下
文件1
mmu-miR-677-5p_MIMAT0017239
mmu-miR-181a-1-3p_MIMAT0000660
文件2
mmu-miR-677-5p_CTTCAGTGATGATTAGCTTCTGA
mmu-miR-677-5p_CTTCAGTGATGATTAGCTTCTGACT
mmu-miR-677-5p_TTCAGTGATGATTAGCTTCTGACT
mmu-miR-181a-1-3p_ACCATCGACCGTTGATTGTAC
mmu-miR-181a-1-3p_ACCATCGACCGTTGATTGTACC
期望的输出
mmu-miR-677-5p_MIMAT0017239 mmu-miR-677-5p_CTTCAGTGATGATTAGCTTCTGA
mmu-miR-677-5p_MIMAT0017239 mmu-miR-677-5p_CTTCAGTGATGATTAGCTTCTGACT
mmu-miR-677-5p_MIMAT0017239 mmu-miR-677-5p_TTCAGTGATGATTAGCTTCTGACT
mmu-miR-181a-1-3p_MIMAT0000660 mmu-miR-181a-1-3p_ACCATCGACCGTTGATTGTAC
mmu-miR-181a-1-3p_MIMAT0000660 mmu-miR-181a-1-3p_ACCATCGACCGTTGATTGTACC
我已经尝试在R,b中使用pmatch()
不要误会。我看起来像perl会处理?
也许是这样的:
perl -ne'exec q;perl;, "-ne", q $print (/\Q$.$1.q;/?"$. YES":$. .q\; NO\;);, "file2" if m;^(.*)_pat1;' file1
当我从CSV文件中读取抱怨STR不是一个特征向量( “?^ *(= _)” 文件1)在stri_extract_first_regex错误: 说法'str'应该是一个字符向量(或者一个强制对象) – user3741035
也许你应该使用'readLines'呢? – gagolews
@ user3741035你应该至少尝试在匹配它们之前阅读文件。这里的答案假设你有基本的读/写R文件。 – agstudy