基于迁移学习的MHC-I型抗原表位呈递预测

胡伟澎; 李佑平; 张秀清 华南理工大学生物科学与工程学院; 广州510006; 深圳华大生命科学研究院; 深圳518083; 华大吉诺因; 武汉4300794; 中国科学院大学华大教育中心; 深圳518083

关键词:免疫治疗 新抗原 抗原呈递 深度学习 迁移学习 

摘要:基于新抗原的肿瘤免疫治疗,抗原呈递的准确预测是筛选T细胞特异性表位的关键步骤。质谱鉴定的表位数据对建立抗原呈递预测模型具有重要价值。尽管近年来质谱数据的积累持续增加,但是大部分人类白细胞抗原(humanleukocyte antigen,HLA)分型所对应的多肽数量相对较少,无法建立可靠的预测模型。为此,本研究尝试利用迁移学习的方法,先利用混合分型的表位数据建立模型以识别抗原表位的共同特征,在此预训练模型的基础上再利用分型特异性数据建立抗原呈递预测模型Pluto。在相同的验证集上,Pluto的平均0.1%阳性预测值(positive predictive value,PPV)比从头训练的模型高0.078。在外部的质谱数据独立评估上,Pluto的平均0.1%PPV为0.4255,高于从头训练模型(0.3824)和其他主流工具,包括MixMHCpred(0.3369)、NetMHCpan4.0-EL(0.4000)、NetMHCpan4.0-BA(0.3188)和MHCflurry(0.3002)。此外,在免疫原性预测评估上,Pluto相对于其他工具也能找到更多的新抗原。Pluto开源网址:https://github.com/weipenegHU/Pluto。

遗传杂志要求:

{1}参考文献尽可能使用近5年公开发表的文献,数量在10—30条,采用顺序编码制著录,依照其在文中出现的先后顺序用阿拉伯数字标出,并将序号置于方括号中,排列于文后。

{2}稿件自来稿之日起三个月内未接到本刊录用通知,作者可自行处理。本刊对决定采用的稿件有权进行删改。

{3}如果能用文字简洁说明的内容就不必列表。图、表按其在正文中出现的先后次序连续编码,每幅图表应冠有图表序号及图题、表题。

{4}基金项目:获得基金资助产出的文章应注明基金项目名称,并在括号内注明其项目编号。

{5}关键词是反映论文主题概念的词或词组,为了便于检索,一般应选取稿件中的关键性词组,数量要适中,3~8个。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

遗传

北大期刊
1-3个月下单

关注 7人评论|1人关注
相关期刊
服务与支付