9月18日,国际学术期刊Nature Communications 在线发表了中国科学院上海生命科学研究院计算生物学研究所韩敬东组的最新研究论文Improved Nucleosome Positioning Algorithm iNPS for Accurate Nucleosome Positioning from Sequencing Data。该研究提出了从MNase测序数据中进行核小体精确定位的最新改进算法,并公开了该算法的应用软件包。
众所周知,核小体是真核生物染色体的基本结构单位,由基因组DNA以特殊的方式缠绕于组蛋白八聚体上形成。而核小体的分布与排列对细胞核内DNA的空间高级结构形成、DNA的复制、转录和基因表达调控起着关键作用。因此,核小体的位置信息与基因表达调控的关系是当前表观遗传学的研究热点。而随着近年来大量的MNase测序数据的发表,使得该领域对更有效的核小体定位算法的需求更为迫切。韩敬东研究组的最新研究建立了更精确、稳定、高效的核小体精确定位算法iNPS,对该领域的研究具有推动作用。
更为重要的是,iNPS不仅可用于核小体位置的鉴定,还可根据核小体的测序分布“峰形”对其进行分类,并揭示了核小体的测序分布“峰形”与该位置转录因子结合密度的相关性。此外,基于iNPS获得的核小体定位信息可有助于分析不同细胞分化状态下的核小体分布信号的变化,对于进一步的生物学功能研究有着重要的作用。
最早的基于测序数据的核小体定位算法NPS于2008年由哈佛大学刘小乐研究组发表。韩敬东研究组吸收了NPS的理论核心算法,并在此基础上加以改进,提出了更精确有效的算法iNPS。与该领域的同类算法相比较,iNPS在高灵敏度、高鲁棒性、高特异性、低假阳性率和使用便捷性等诸多方面有着综合的优势。
计算生物学所博士研究生陈威中和原该所副研究员、现北京交通大学教授刘一为本文的共同第一作者,该研究工作得到了国家自然科学基金委、科技部、中科院和上海市科委等经费的支持。
上海生科院提出改进的核小体精确定位算法iNPS