有助于阐明遗传疾病机理的生物化学反应预测技术

本技术介绍参考了以下链接
English

2019年09月22日

有助于阐明遗传疾病机理的生物化学反应预测技术
可大量预测未知的化学反应,促进新药开发及精密医学的发展

株式会社富士通研究所 (注1) (以下简称:富士通研究所)、爱尔兰的数据分析研究机构The Insight Centre for Data Analytics (注2)(以下简称:Insight)与Fujitsu Ireland Ltd. (注3)三家公司共同联手开发了一项技术,可以预测大量未知的化学反应,预测量约是常规方法的2倍左右。

开发背景

在身体内部,细胞中的各种蛋白质通过化学反应进行信息交换并以此维持生命机能。近年来,人们发现癌症等众多严重疾病,都是由磷酸化反应异常导致的,而这正是蛋白质之间典型的化学反应。如果能够研发出可修复磷酸化反应异常的药物,就可以进行更有效的治疗。然而,目前已知的磷酸化反应还很少,因此我们急需发现未知的磷酸化反应,以此丰富磷酸化反应的数据。

课题

磷酸化反应是指一个蛋白质将磷酸基团加在另一个构成蛋白质的氨基酸上的化学反应。为了发现它们,需要通过生物学实验确认哪种蛋白质组合会导致磷酸化反应的发生。然而,仅是蛋白质的组合就约有80多万种,规模庞大,实施生物学实验需要花费大量资金和时间,因此需要事先对准确率高的蛋白质组合进行预测。

众所周知,是否发生磷酸化反应取决于构成蛋白质的氨基酸序列的结构。通过对已知的导致磷酸化反应的氨基酸序列结构进行学习,AI技术已被用于预测新的磷酸化反应。然而,当氨基酸序列结构与已知的导致磷酸化反应的氨基酸序列结构相似时,该技术虽然能够进行预测,但当氨基酸序列结构与已知的磷酸化反应有很大差异时,则无法进行预测。

figure1

图1. 传统的AI技术


开发的技术

医学界近年来的研究表明,引起磷酸化反应的蛋白质与其它蛋白质产生的连锁磷酸化现象(连锁信息),成为预测是否存在新的磷酸化反应的线索。基于该发现,此次,除了氨基酸序列的结构信息,我们将连锁信息也表示在了知识图谱 (注4)上。据此,富士通研究所开发了一种技术,可将复杂的化学反应模式的优化属性表示出来,并将这些属性赋予给知识图谱的线条(已申请专利)。由于这些属性是通过知识图谱为复杂结构量身定制的,因此可以得到高精度的预测结果。以往,蛋白质间的关系只能通过一次连锁的信息来确定。此次,通过综合表示磷酸化反应的联系(连锁信息),可以从整体明确每种蛋白质的定位,使对未知关系的预测成为可能。

figure1

图2. 基于知识图谱的磷酸化反应预测示意图


效果

当利用评估数据 (注5)对该技术进行验证时,我们对该模型进行了磷酸化反应(9,802个)的训练,并预测出了新的磷酸化反应11,581,940个。与利用AI学习氨基酸序列结构的传统技术相比,在没有大幅改变预测精度的情况下,该技术实现了大量的磷酸化反应预测,预测量约为从前的2倍。 

另外,为了验证基于该技术预测的磷酸化反应在实际的生物体内发生的可能性,作为共同研究伙伴,爱尔兰生物学研究机构Systems Biology Ireland (注6)利用质谱仪和抗体进行了验证实验。生物学专家们选择了一些他们认为重要的且与癌症有关的蛋白质的磷酸化反应预测结果并进行了测试,9个磷酸化反应得到了证实,其中8个是传统技术未曾预测到的反应。 

系统生物学研究的世界权威,Systems Biology Ireland的Kolch所长对该成果发表了如下看法:“此次通过将富士通研究所和Insight的知识图谱技术与Systems Biology Ireland生物学网络的知识进行整合,开发出了一种新的计算方法,可以发现未知的磷酸化位点,它将是新药研发和精密医学 (注7)发展的重要的一步。

今后

通过将该技术最新预测的磷酸化反应数据与其它生物医学数据相结合,我们期待可以掌握从病理原因(磷酸化反应异常)到疾病发病的整个化学反应流程,在药品研发时作为有用信息提供给研究现场。另一方面,治疗癌症等药物的效果虽因患者而异,但我们相信,基于该技术,未来将可阐明药物效果的个体差异,为促进适合患者的治疗做出贡献。 

富士通研究所、Insight及Fujitsu Ireland Ltd.,致力于进一步推进知识图谱上生物医学数据处理技术的精度,同时富士通株式会社(以下简称:富士通)也将拓展正积极推进的生物医学方面的项目。此外,通过将该技术采用到富士通的AI技术“FUJITSU Human Centric AI Zinrai”中,我们计划加速生物医学领域的业务发展。

注释

 注1 株式会社富士通研究所:
社长 古田 英范
总公司所在地 日本神奈川县川崎市
 注2The Insight Centre for Data Analytics:
地址 爱尔兰 戈尔韦、CEO Oliver Daniel。由爱尔兰科学财团运营的欧洲最大级别的数据与分析研究机构。Insight在爱尔兰国内拥有多个分支机构,本次发表是和位于爱尔兰国立大学Galway校内分支机构的共同研究。
 注3Fujitsu Ireland Ltd.:
CEO Tony O’Malley
总公司所在地 爱尔兰 都柏林
 注4知识图谱:
是指被赋予了意义的图结构的知识库。将从各种信息源收集的信息按意思的关联性进行连接。
 注5评估数据:
应用了磷酸化反应数据库PhosphoSitePlus(*)以及蛋白质序列数据库UniProt
(*)Hornbeck PV, Zhang B, Murray B, Kornhauser JM, Latham V, Skrzypek E PhosphoSitePlus, 2014: mutations, PTMs and recalibrations. Nucleic Acids Res. 2015 43:D512-20.
 注6Systems Biology Ireland:
地址 爱尔兰 都柏林、 所长 Walter Kolch。 是一个专注于开发最新癌症治疗方案,专门研究细胞信息传输的系统生物学研究机构。
 注7精密医学:
是一种考虑到个人在遗传信息、生活环境或生活方式上的差异,从而进行疾病治疗和预防的新型医疗。