近日,广州国家实验室苗智超团队联合国内多所高校及欧洲生物信息研究所等国际团队,在核酸研究领域顶刊Nucleic Acids Research(NAR)集中发表三篇重磅研究论文,成功构建RNA适配体数据库(Ribocentre-aptamer)、RNA糖基化数据库(GlycoRNAdb)并升级优化RNAcentral综合数据库。系列成果不仅填补了RNA研究领域数据整合的多项空白,更以精准数据和创新技术工具,为呼吸疾病的机制解析、诊断技术研发及靶向治疗突破提供了核心资源平台,彰显了我国在RNA医学研究领域的领先地位。
RNA作为生命活动的核心分子,可以编码遗传信息、进行自我催化、执行生命功能,是遗传中心法则的核心分子。其序列、结构、功能及修饰状态与呼吸系统疾病的发生发展密切相关。从气道上皮细胞损伤修复、肺部免疫调控,到病毒感染机制、肿瘤恶性进展等,RNA分子的动态变化均扮演关键角色。然而,长期以来,RNA相关研究数据分散、功能注释不系统等问题严重制约了呼吸疾病领域的基础研究向临床转化。广州国家实验室苗智超团队聚焦这一关键瓶颈,历时多年联合多方力量开展数据库构建研究,形成了覆盖RNA适配体、糖基化修饰及综合序列资源的全方位数据支撑体系。
本次发布的三大数据库中,Ribocentre-aptamer数据库整合了669篇研究文献中的191种RNA适配体信息,系统收录其与靶标分子的实验解析结构、结合特征及应用开发时间线。RNA适配体凭借合成周期短、稳定性强、亲和力高等优势,在生物传感、靶向递送等领域具有独特价值。在呼吸疾病研究中,该数据库可直接为流感病毒、新冠病毒等呼吸道病原体的快速检测提供适配体设计模板,同时为肺癌、慢性阻塞性肺疾病等疾病的靶向药物递送系统研发提供数据支撑,助力解决传统检测方法灵敏度不足、治疗药物脱靶率高等难题。数据库提供的批量下载功能及标准化数据样本,更能加速AI驱动的新型适配体设计,推动呼吸系统疾病精准诊断技术的迭代升级。(数据库链接:https://aptamer.ribocentre.org/)
图1 Ribocentre-aptamer数据处理流程及网络门户概述。该平台将数据采集、整理与可视化功能整合于单一高效流程之中。
GlycoRNAdb作为全球首个RNA糖基化专业数据库,收录了32种组织/细胞类型、11种RNA类别(如tRNA、snoRNA、snRNA等),支持1426个质谱数据集和21篇文献来源。RNA糖基化作为新兴研究领域,其在细胞表面免疫识别、细胞间通讯中的关键作用已逐步揭示。在呼吸系统中,气道上皮细胞表面的glycoRNA可能参与病原体黏附与免疫应答调控,外泌体中的glycoRNA更可能成为疾病进展的新型生物标志物。该数据库通过精准映射糖基化位点与基因组特征,为探索哮喘、肺纤维化等疾病的免疫紊乱机制提供了全新视角,同时为开发基于glycoRNA的新型诊断标志物和治疗靶点奠定基础。(数据库链接:http://www.glycornadb.com)
图 2 GlycoRNAdb数据网站概述。

升级后的RNAcentral综合数据库已收录约4500万条非编码RNA序列,新增文献整合与基因层级条目两大核心功能。LitScan工具可自动关联RNA条目与相关研究文献,LitSumm则通过自然语言处理技术生成功能性摘要,有效解决了RNA研究中序列数据与功能知识脱节的问题。基因层级条目功能将相关转录本整合为基因中心视图,方便研究人员系统分析目标基因的RNA异构体及剪接变体,为解析疾病分子机制、发现新型治疗靶点提供全面的数据支持。该数据库整合了广州国家实验室苗智超团队联合中山大学孙逸仙纪念医院黄林团队开发的核酶、核糖开关等系列数据库资源,形成了更为完整的“RNA序列-结构-功能” 数据体系。(数据库链接:https://rnacentral.org)
广州国家实验室作为呼吸疾病研究的核心阵地,始终聚焦国家重大健康需求,致力于通过基础研究突破带动临床转化创新。苗智超团队牵头构建的三大RNA数据库,不仅为全球RNA研究提供了开放共享的公共资源,更针对性地解决了呼吸疾病研究中数据整合不足、技术工具缺乏等关键问题。系列成果通过系统整合RNA分子的多维度信息,为呼吸系统疾病的机制研究、诊断技术研发及靶向治疗提供了全新的研究范式和数据支撑。
未来,广州国家实验室将持续推进RNA数据库的更新与优化,进一步拓展数据覆盖范围、提升分析功能,同时加强与国内外科研机构的合作,推动数据库在呼吸疾病基础研究、药物研发及临床诊断中的广泛应用,为攻克呼吸系统重大疾病、保障国民健康提供更强有力的科技支撑。
来源:广州实验室微信公众号