针对第三代RNA测序长读段的比对算法研究

发布时间 2023-05-31 09:31:06作者: wangchuang2017

针对第三代RNA测序长读段的比对算法研究

李琪

桂林电子科技大学

摘要:随着第三代测序技术的日益成熟以及广泛应用,长序列比对成为正在兴起的研究领域。在转录组学研究中,将RNA长读段比对定位到参考基因组中,是对第三代RNA测序数据进行分析的关键一步,其准确性对差异基因表达、RNA编辑和融合基因的检测等后续分析有着至关重要的影响。然而,第三代RNA测序数据具有读段长、错误率高、高通量的特点,为RNA长读段比对算法设计带来了挑战。现有相关算法普遍在对结构复杂、规模较大的基因组上进行RNA序列比对准确率较低;其次,这些方法比对的很多位置与真实位置还存在偏差,导致外显子边界识别的准确率不高。因此,本文设计并实现了一套针对第三代RNA测序读段的比对算法流程,命名为WFMap。该方法通过索引和预比对策略进行全局搜索,首先找到RNA片段可靠的、大致的位置,再通过精细比对,对第一阶段比对的位置进行局部调整,最终实现准确地、高效地将RNA序列各个部分精确定位到基因组上。本文的主要研究方法如下:首先,通过使用minimizer的索引方法对参考基因组进行索引。根据计算自定义窗口内的minimizer构造minimizer的哈希索引。其次,采用基于种子-扩展策略的方法将读段和参考基...更多
  • 专辑:

    基础科学;信息科技

  • 专题:

    生物学;计算机软件及计算机应用

  • DOI:

    10.27049/d.cnki.ggldc.2022.000196

  • 分类号:

    TP311.13;Q811.4

导师:

张艳菊;

学科专业:

软件工程