sequencing

    0热度

    1回答

    我的理解是,配对末端从Illumina的HiSeq/MiSeq平台读取看起来是这样的: R1: AAAAAACCCCCC R2: GGGGGGTTTTTT 当读取R2发现是那些在R1中发现的反向互补。但是,对于我的测序数据,这似乎并不是这种情况。如果有帮助,我可以从下面的一个MiSeq运行中读取一对。 R1: @M01814:86:000000000-A6MU9:1:1

    0热度

    2回答

    我想编辑一个排序Fastq文件,并删除只在某些字符位置重复的行。理想情况下,我将遍历输入文件中的每一行,并输出一个只包含任何唯一字符集的单个实例的文件。 如下图所示。我只想看看前6个字符,后6个字符和每行的中间字符的一部分,并且只保留三个序列的每个独特组合的一个实例。 AAAAAACCCCCCCCCCCCTTTTTTTTTTCCCCCCCCAAAAAA Start by comparing to

    1热度

    1回答

    我将GPS点与索引一起存储 - 所以在这个问题中引用这些点时,它会看起来像这样的GPS [0],GPS [1],其中GPS是GPS位置并且[n]是GPS位置阵列中的索引。 这里是我会如何被存储的位置(在这个例子中该阵列只包含11个地点): GPS [0] =道路的起点 - 总是在第一索引 GPS [ - 9]点以捕获不是所有的[1:道路10] =端 - - 总是在最后一个索引 GPS [1 9]

    0热度

    2回答

    我已经花了太多的时间在这,我期待的建议。我有非常大的文件(对于那些感兴趣的人来说,Illumina测序运行的FASTQ文件)。我需要做的是不匹配的重复(存在于原始文件),该行的文件和打印,加上3个系在其下方为两个单独的文件之间的共同模式。 Grep这样做很好,但是文件大约18GB,并且它们之间的匹配速度很慢。我需要做的例子如下。 FILEA: @DLZ38V1_0262:8:1101:1430:2

    0热度

    1回答

    我有一些来自Illumina NextSeq运行的.fastq文件。许多序列具有polyA片段,这使得它们映射变得复杂。我想删除的连续十A的所有序列,并一直在努力这样做,使用fastx_clipper如下: ha1c6n8$ fastx_clipper -l 32 -Q33 -n -v -a AAAAAAAAAA –i FR0826_S1_L004_R1_001.fastq –o FR0826_L

    0热度

    2回答

    我试图限制用户通过测验时可以尝试的次数,而不管内容启动次数。 我发现了一个先决条件规则,但我认为这只适用于当前的启动尝试。 有没有人成功地做到这一点? sco很迷人。

    1热度

    1回答

    我需要我的对齐文件都是bowtie和samtools格式,以便我可以在稍后的管道中将它们送入不同的程序。有什么方法可以将sam对齐文件转换为bowtie对齐文件,反之亦然? 另一种方法是做两次对齐,并让领结程序以不同的格式输出它。但是,这浪费了太多时间。

    -1热度

    3回答

    我有一个表格,里面包含左右鞋的混合物,其中一些是防水的。 我需要编写一个查询来按字母顺序对它们进行排序,但是当名称相同时,请使用左侧/右侧前面的防水列。 例如 +-------------------------+------------+------------+ | Shoe name | Waterproof | Left/Right | +--------------------

    0热度

    1回答

    对于R,我真的很新,所以对不起,如果我没有完全理解。 我有一个DF数据收集在几个不同的领域,称为STAND。我需要为从1:3运行的数据创建一个序列,但是当涉及到新的STAND号码时,必须重新启动序列。 下面是一些虚拟的数据 STAND TREE_SPECIES DIAMETER 1 101737 Pine 276 2 101737 Spruce 98 3 101737 Spruce

    0热度

    1回答

    我想使用bwa mem将序列读取与hg19引用进行比对,但是我的序列都有一个UMI(唯一分子标识符)。我用umitools像这样: umitools trim --end 5 input.fastq NNNNNN > output.fastq 这再正常附加我的UMI序列中output.fastq文件名行,但是如果使用BWA MEM对准的时候,我得到的错误: paired reads have