bioinformatics

    0热度

    1回答

    的列表中提取的碱基我有兴趣例如位置的列表: 10 20 1000 4000000 我想提取在使用biopython一个FASTA文件,这些位置的碱基响应。 这是我曾尝试: query_dic ={} with open(line) as pos_file: for x in pos_file: for seq_record in SeqIO.parse(query

    1热度

    1回答

    我有以下input: >Thimo_0001|ID:40710520| hypothetical protein [Thioflavicoccus mobilis 8321] LIAPTMILRIRLTEFCPMRTEGFEE TGIGPLDSRMPRYDDVVHHREIIT YPPEALSNDPFDPTSIDGSPSAFF* >ThimoAM_0002|ID:40707134| prot

    -1热度

    3回答

    我是R新手,需要一些帮助。我有一个庞大的数据框与不同的患者样本。每名患者有24'chrom。每个'铬'有3个部分。以下是病人'A2461'的例子。下面是一些我拥有的数据的一个例子: ID chrom loc.start loc.end num.mark seg.mean seg.sd seg.median seg.mad 1 A2461 1 61735 23342732 13103 0.0

    0热度

    2回答

    我正在研究一个生物信息学项目,我正在研究非常大的基因组。 Seg一次只能读取135行,所以当我们喂食基因组时,它会被超载。我正在尝试创建一个perl命令,将这些部分拆分为135行部分。由于有80列,因此字符数限制为10,800。这是我迄今为止 #!usr/bin/perl use warnings; use strict; my $str = '>AATTCCGG TTCCGGAA

    1热度

    1回答

    我有一个关于reutils package的问题。有一个叫做esearch()的功能可以让你搜索GEO数据库。所以,我进入了,我会在GEO使用相同的查询: UIDs <- esearch(term = "METHYLATION PROFILING BY ARRAY[DATASET TYPE]") 但esearch()不承认DATASET TYPE。 如何将数据集类型指定为esearch()?

    1热度

    1回答

    我正在尝试绘制一些测序数据,并且希望仅从缩放比例计算中排除染色体4数据(其中第一列中的行具有'4')。染色体4可能会使正态化平均值/ Sd计算偏斜,所以我想从我的scale()函数中排除它。有没有办法做到这一点?现在,我有: preMBT_RT <-preMBT_RT %>% mutate_each_(funs(scale(.) %>% as.vector),vars=c("Timing"))

    1热度

    1回答

    如果我给AVGQUAL命令:20没有滑动窗口它会设置滑动窗口的任何默认值?

    0热度

    1回答

    我有一个序列比对为: RefSeq :MXKQRSLPLXQKRTKQAISFSASHRIYLQRKFSH ..... Templatepdb:-----------------ISFSASHR------FSHAQADFAG 我想写的是重号基于在PDB文件这对准作为残留代码: 原始pdb:RES ID = 1 1 1 1 1 1 2 2 2 2 3 3 3 3 3 4 4 4 4 4

    1热度

    2回答

    有谁知道为什么这不起作用?有什么不对的地方叫org.Hs.eg.db。 ego <- enrichGO(gene = gene.df, universe = names(geneList), OrgDb = org.Hs.eg.db, ont = "CC", pAdjustMethod = "BH", p

    3热度

    1回答

    我需要根据最大(峰值)磁盘使用情况对工具进行基准测试。我们观察到该工具会在磁盘上创建临时文件。 所以,我想知道它在执行过程中使用了多少峰值磁盘空间(写入的字节)来存储临时文件。