北京大学|设为首页|加入收藏|English|书记、院长信箱

科研动态

材料科学与工程学院莫凡洋课题组开展AI for Science交叉研究取得新进展

发布者:  时间:2023-06-09 15:33:01  浏览:

手性分离是合成化学、材料科学和生物制药等领域中的一个重要问题。手性分离技术可以将一种化学物质中的多种手性异构体分离出来,从而获得高纯度的手性异构体,在制药、生物化学、农业化学等领域具有广泛应用。目前主流的手性分离方法之一是高效液相色谱(HPLC)。在色谱对映体分离中,实验条件的选择,包括HPLC柱类型、流速和展开剂比例,目前仍然是由经验和试错得出的。这是一个繁琐且耗时的过程,导致了实验效率低下与资源浪费。

图1人工试错与人工智能预测手性分子色谱分离条件的对比


莫凡洋课题组采用机器学习技术来预测手性分子在高效液相色谱中的保留时间,并提出分离概率这一指标以辅助预测色谱手性分离条件。为了解决数据采集的问题,研究者从644篇不对称催化文献中自动提取实验结果,建立了手性分子保留时间数据集(CMRT数据集)。同时,研究者提出一种分位数几何增强图神经网络(QGeoGNN),用于学习分子结构与保留时间的关系。为了拓展模型的实用性,色谱的领域知识被融入到机器学习模型中,实现了多柱预测。在此基础上,研究者进一步提出了分离概率指标,以衡量手性分子在给定条件下的分离概率,从而快速准确地预测最优的手性分离实验条件。

图2色谱对映体分离预测模型实施路径


研究表明,该研究框架在保留时间预测和色谱分离条件预测方面表现良好,为机器学习技术在化学实验场景中的应用带来了新的视角,并提高了实验效率,从而加快科学发现的速度。


相关研究成果发表于Nature Communications(Doi: 10.1038/s41467-023-38853-3),莫凡洋副教授和张东晓教授(北京大学工学院,宁波东方理工大学)为本论文的共同通讯作者。北京大学博士生徐浩是本论文的第一作者,北京大学博士生林京龙是本文的第二作者。该项研究工作得到了国家自然科学基金的资助。


论文链接:https://doi.org/10.1038/s41467-023-38853-3