DIA 质谱数据分析

随着生命科学的快速发展,蛋白质组学的关注焦点和研究趋势已经逐渐从定性转向定量。定量蛋白质组学是对细胞、组织乃至整个生物体的蛋白质表达量及差异进行分析,对于生物过程机理的探索和临床诊断标志物的发现与验证具有重要意义。基于静电场轨道阱 Orbitrap 的数据非依赖采集(DIA,Data independent acquisition)是一项全新的、全息式的质谱技术。DIA 将质谱整个全扫描范围分为若干个窗口,高速、循环地对每个窗口中的所有离子进行选择、碎裂、检测,从而无遗漏、无差异地获得样本中所有离子的全部碎片信息。但如此大的母离子隔离窗口将会同时引入大量肽段,将其同时碎裂,这些窗口里会同时引入数十个甚至数百个共碎裂的肽段,从而产生了高度混合而卷积的MS2谱图。从这些谱图提取准确的蛋白定性和定量信息,一直是一个难题。

该研究方向主要包含如下子课题:

l 利用深度学习算法进行谱图信息提取

l 利用机器学习算法进行蛋白肽段的识别和错误率控制,提高 DIA 数据有效肽段的产出

合作导师:韩家淮、帅建伟、钟传奇

学生:高铭暄、刘亚琛、李陈鑫