怎么区分reads来自哪个单倍型基因组?

2024-11-19 阅读 86
更新于 2024年11月21日
hifiasm好像就可以区分,不过最好能够测父本母本的二代测序,将三代测序拆分出来,这个方法有文献支撑,搜索一下就能找到。
1. 映射 HiFi Reads 到两个基因组将 HiFi reads 分别映射到两个单倍型基因组(hap1 和 hap2)上。推荐使用 Minimap2,它适用于长读长数据(如 HiFi reads)。将 HiFi reads 分别映射到 hap1 和 hap2 基因组:
minimap2 -ax map-pb hap1.fasta hiFi_reads.fastq > hap1_reads.sam
minimap2 -ax map-pb hap2.fasta hiFi_reads.fastq > hap2_reads.sam 通过比对结果,你可以看到哪些 reads 映射到 hap1,哪些映射到 hap2。那些只映射到一个基因组的 reads 就可以确定是来自这个单倍型。
2. 使用 HAPCUT2 (如果需要更精确的区分)如果你想更精确地将 HiFi reads 分配到 hap1 或 hap2(尤其是当某些 reads 会同时映射到两个基因组时),可以使用 HAPCUT2 来进行单倍型分配。安装并使用 HAPCUT2 来基于你的 HiFi reads 和两个单倍型基因组进行单倍型分配:
./HAPCUT2 -i reads.mapped -g hap1_hap2_reference.fasta -o phased_output