bioinformatics

    0热度

    1回答

    目标:mas5正常化数据。 问题:当我尝试以下方法R代码里面,我得到这个 error: unable to find an inherited method for function bg.correct for signature ExpressionFeatureSet, character 我有这么看着,发现以下几点:What does this mean: unable to find

    1热度

    1回答

    我是新来snakemake,并希望能够通过trim_galore采取任何一对.fq文件或一对文件,并运行他们得到一副修剪的输出文件。没有给我所有的Snakefile,我有下面的丑陋的解决方案,我刚刚复制规则并更改输入。什么会是更好的解决方案? #Trim galore paired end trimming rule for unzipped fastqs: rule trim_galore_u

    1热度

    1回答

    从VIPREADME.md文件: 安装 一台机器上安装VIP的步骤如下: > git clone https://github.com/keylabivdc/VIP > cd VIP > cd installer > chmod 755 * > sudo sh dependency_installer.sh > sudo sh db_installer.sh -r [PATH]

    2热度

    1回答

    我想用它来转换一堆标识符,但我需要确切地知道哪个分类等级被分配给每个分类标准代码。下面显示的是一个有意义的转换示例,但我不知道如何标记某些分类调用。基本的分类等级是:(域,王国,门,类,次序,家庭,属和物种)https://en.wikipedia.org/wiki/Taxonomic_rank。 对于大多数情况下,它很容易,但在细菌的亚种和菌株的情况下,这可能会引起混淆。 如何获得ete3来指定

    0热度

    1回答

    我正在配置Blast +在我的mac上(os sierra)并且在配置我也在本地下载的nr和nt数据库时遇到了问题。我正在尝试关注NCBI的指令here,并且正在执行配置和执行步骤。 他们说改变我的.bash_profile,以便它说: export PATH=$PATH:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/ncbi-blast-2

    18热度

    4回答

    我特别关注R,Perl和shell。但任何其他编程语言也可以。 问题 有没有一种方法,以在视觉上或程序检查和指数基于正则表达式匹配的字符串?这是为了引用第一个正则表达式及其第二个正则表达式的结果,以便能够修改匹配字符串的一部分并为该特定部分编写新规则。 https://regex101.com确实可视化某个字符串如何匹配正则表达式。但它远非完美,对于我的庞大数据集效率不高。 问题 我有我的第一个正

    2热度

    1回答

    我正在使用Python 2.6.6,并且我试图删除中的,它们与file1中的读取重叠(即相同)。这里是代码我想实现: ref_reads = SeqIO.index("file1.fastq", "fastq") spk_reads = SeqIO.index("file2.fastq", "fastq") for spk in spk_reads: if spk in ref_r

    1热度

    1回答

    我想用命令system()在R中运行shell脚本(BLAST + in NCBI),但它似乎只使用一个线程,即使我在shell脚本中设置了多个线程。在这种情况下,我应该怎么做才能使用多线程? 的代码是 system("blastp -query query.fasta -db db.fasta -num_threads 16 -outfmt \"6 qseqid sseqid pident pp

    0热度

    1回答

    我想使用gatk重新校准使用对样本(肿瘤和正常)。我需要使用熊猫来解析数据。这就是我所写的。 expand("mapped_reads/merged_samples/{sample[1][tumor]}/{sample[1][tumor]}_{sample[1][normal]}.bam", sample=read_table(config["conditions"], ",").iterrows

    0热度

    1回答

    我想使用snakemake制作一个生物信息学流水线,并使用Google搜索它并阅读文档和其他内容,但是我仍然不知道如何使它工作。 这是我的一些原始数据文件。 RAWDATA/010_0_bua_1.fq.gz,RAWDATA/010_0_bua_2.fq.gz RAWDATA/11_15_ap_1.fq.gz,RAWDATA/11_15_ap_2.fq.gz ...他们都是配对的文件。) 这里是我