蛋白质组学AI大数据模型在DeeCamp夺冠

北京日报客户端 | 记者 孙奇茹

8月31日,DeeCamp2022人工智能训练营总冠军答辩暨结营典礼线上举行。经过一上午的激烈答辩,挑战大规模蛋白质组学信息发现赛题的ProteinMiner团队摘得DeeCamp2022总冠军的荣誉。

DeeCamp人工智能训练营是创新工场发起的一项面向全球大学生的公益项目,专注培养应用型AI人才,迄今已经举办六届。DeeCamp2022的主题是“用AI探索生命科学新边界”,由创新工场和清华大学智能产业研究院(AIR)联合主办,来自全球各个地区顶尖高校的计算机、生命科学等专业的150位学员自发组成30支队伍,经过两个月的课程学习和项目实践,最终共六支队伍入围最终答辩环节。

蛋白质是生命活动的真正承担者。获取蛋白质的序列和结构信息,对于疾病的研究、药物的研发尤为重要。质谱作为一种生物表征仪器,在蛋白质测序领域有着支配性的地位。但面对大规模的未知序列蛋白,现有的质谱从头测序技术仍面临精度低的问题,而这是推动新抗原发现驱动的个性化免疫疗法亟待解决的难题。

获得本届年度总冠军的ProteinMiner团队,立足于AI与大数据驱动的蛋白质的质谱测序技术,致力于提升大规模地发现未知的蛋白序列与结构信息的能力。ProteinMiner首次提出预训练的AI谱图语言大模型,提升质谱从头测序的精度,加速免疫相关的新抗原/抗体的发现,以推动个性化免疫治疗的进程。此外,ProteinMiner提出谱图分类深度模型,实现快速的交联质谱数据的鉴定,构建实验数据支撑的组学规模的蛋白质空间距离信息数据库。

ProteinMiner团队的队长毛鹏志是中科院计算所计算蛋白质组学/信息检索方向的博士生,队员还包括香港中文大学(深圳)计算机视觉硕博生叶崇杰、中科院计算所生物信息学博士生齐晓宁、香港中文大学(深圳)数据科学与大数据技术专业本科生薛浩楠。

创新工场董事长兼CEO、HICOOL商学院荣誉院长李开复提到,“AI+科学”交叉是创新工场预测未来5到10年间会引爆的创新增长新范式,“AI+生命科学”更是造福人类、影响深远的黄金赛道。这也是6年来一贯倡导“学以致用”的DeeCamp首次聚焦AI+生命科学这一命题的深意所在。

DeeCamp2022联合主办方、清华大学智能产业研究院院长张亚勤院士说:“生命科学与生物医药领域正在步入数字化 3.0 时代,以人工智能和数据驱动的第四科学研究范式,将辅助人类探索并解决生命健康的问题,加速生命健康与生物医药领域向着更快速、更精准、更安全、更普惠的方向稳步发展。这既是AI for Science(科学智能)的重大机遇,同时也将造福全人类。”

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章