
13日,西安交通大学记者获悉,针对这一挑战,西安交通大学叶凯教授团队近期提出了一种标注框架——基于混合专家架构的ANNEVO深度学习遗传离子。
团队系列赛结果总结。图片提供:西安J交通大学
据了解,ANNEVO 是围绕两个关键问题设计的:“进化异质性建模”和“长程上下文建模”。从模型架构的角度来看,该方法首先区分宏观层面上存在差异的大型生物群体,并最大限度地减少进化距离较大的物种之间的信号干扰。此外,在群体内部,我们使用混合专家机制来自动学习不同亚群体特有的遗传结构模式,提高模型对复杂生物多样性和物种间差异的适应性。同时,ANNEVO引入了远程上下文建模模块,以适应基因组序列中局部模式和全局模式共存的复杂特征。前者体现在短程保守信号上,如剪接位点、起始密码子和终止密码子,后者体现在长程依赖性上,如长程的协作。ge 外显子、长基因的结构组织和区域间关联。
除了在特征学习层面取得进展外,ANNEVO还在预测输出阶段融入了与基因结构相关的生物约束机制,在解码过程中明确考虑了外显子、内含子、剪接位点、起止密码子、阅读框连续性等生物规则。该模型不仅具有深度学习技术强大的模式提取能力,还考虑到了基因预测任务中严格的生物学一致性要求。
我们的结果表明,该方法可以同时模拟不同生物群体之间的进化规则和基因组内的远程序列依赖性。仅基于DNA序列即可实现高精度从头基因注释,无需同源RNA或蛋白质序列等外部证据。这种方法不仅显示了良好的ge跨多个系统发育分支的neralizability,但也可用于纠正现有参考数据库中的错误注释,为新的基因组分析和参考注释的改进提供了新技术途径。
ANNEVO 法则的一般描述。图片提供:西安交通大学
这项研究表明,基因注释正在从严重依赖外部实验数据和人工规则的传统范式转向更加智能和自动化的新阶段。 ANNEVO的提案不仅为数据匮乏的物种提供了可行的高质量注释解决方案,还为大规模生物基因组项目提供了更具可扩展性的技术支持。同时,这一成就打破了国外的先例,特别是在德国。中国研究团队在该领域20多年的技术优势,使中国在核心基因注释方法上取得了重大突破,进一步加强了增强我国在智能基因组学关键技术领域的独特创新能力。
该研究对于贡献国家生物安全战略、推动人工智能与生命科学全面相互融合、增强我国在生命大数据核心技术领域的国际竞争力具有重要意义。 Jan未来,我们预计 ANNEVO 将在更广泛的基因组功能分析场景中发挥作用,因为该模型将扩展到更复杂的注释任务,例如非编码 RNA 和选择性剪接。
相关成果于2026年3月12日发表在国际领先期刊《Nature》上,题为《High- precision ab initio Genetic annotation with ANNEVO》,在线发表在Methods上。西安交通大学电信学院自动化学院博士生张鹏宇为论文第一作者,叶凯教授为通讯作者作者。
叶凯教授团队表示,加快生命科学进入“基因组大数据”时代,推动人工智能与基因组学深度融合,加快构建自主可控的核心方法体系,已成为登顶生命科学前沿的重要方向。多年来,研究团队围绕“利用人工智能进行基因组分析”进行了系统的研究和技术部署。随着相关研究的不断推进,团队逐渐形成了覆盖基因组变异鉴定、基因功能注释等关键环节的连续方法链,并在达尔文生命之树等国际旗舰基因组项目中展现了显着的应用价值。 (完)
今天将有20多个州举行公务员考试,年龄要求全面放宽。
龙虾的人气已经消失而众生的节日才刚刚开始。
被曝光并整顿一年后,啄木鸟又回来了,但仍然是一个“良心杀手”。
“129岁老夫妻相爱100年”是谎言,涉事账号受罚
中新网时评:外卖平台抢占市场,卖家不能当待宰羔羊
为什么商家有补贴,我的外卖订单价格却不断上涨?
美国欲从中东撤军
“文化博物馆旅游”为何如此受欢迎?
名人长期以来一直受到人工智能视频的困扰。面貌改了,保养了,价格也明码标价。
从工厂参观到学习体验,“工业旅游”成中国亲子游新流行
这是日本第一次无力单独释放其战略石油储备。
这被称为“龙虾养殖”,但在小镇上居然出现了一个伟大的产业。
走下楼梯,走向大地——关于第十四届全国人大四次会议闭幕的笔记
美国“玩火” 多国紧急采取措施挽救油价
中国第二部法典出台,用法律的力量保护生态之美。
五年规划法体现了中国治国理政的决心和合力。
当AI视频越来越“以假乱真”时,我们如何筑起“防火墙”?
全国政协委员赵红:医疗创新不是止于文件,必须到达患者身边。