如何解决使用Cutadapt进行fastq修整后的Phred质量错误
在映射到bowtie2的基因组之前,我想将fastq文件中所有读取的开头修剪给定长度。我已经用过Cutadapt:
cutadapt -u 48 -o output.fastq.gz input.fastq.gz
修剪后我的fastq文件看起来像这样:
gunzip -c output.fastq.gz | head
@NB502143:99:HFF7TAFX2:1:11101:4133:1019 1:N:0:ATCACG
CATGAAAAAGAGCTCATTTTCAGATGCAGGAATTCCTATCCG
+
EEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEE
@NB502143:99:HFF7TAFX2:1:11101:19790:1020 1:N:0:ATCACG
CATGATCCACTTTTCCACGCGCTTTGACGACCATTTTATAA
+
EEEEE<EEEEEEEEEEEEEEEEE<EE/EEAEEEEEEEEEEE
@NB502143:99:HFF7TAFX2:1:11101:6327:1020 1:N:0:ATCACG
CATGATCTCAGTAAAGGCATTTGTGGTTGTTAAGTAGCCATT
当我尝试用bowtie2映射它时,出现以下错误消息:
Saw ASCII character 10 but expected 33-based Phred qual.
如果我映射input.fastq.gz我没有得到这个错误,所以我怀疑在修剪过程中发生了什么问题,但是我不知道是什么! 我用FastQC检查了两个文件,它们都是Sanger / Illumina 1.9编码的。
感谢您的帮助。
解决方法
我一直遇到类似的问题。当我使用cutadapt
时会发生该错误,但是当我使用另一工具fastp
进行修整时不会发生此错误。
检查生成的修剪后的fastq
文件的完整性,发现某些读取没有碱基。 fastq_utils包中的fastq_info
之类的工具可以使用。
如果存在问题,则在运行-m <minimum-length>
时可能需要使用cutadapt
标志。这将删除指定长度以下的读段。如果那是问题所在,那么之后的对齐应该可以。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。