%0 Journal Article %A 许心怡 %A 张堃然 %A 沐勇 %A 吴建盛 %T 一种用于优化分子属性预测的双层模型轻量化方法 %D 2025 %R 10.13232/j.cnki.jnju.2025.06.006 %J 南京大学学报(自然科学版) %P 953-962 %V 61 %N 6 %X

分子属性预测在新药研发和材料设计等诸多科学领域中具有重要作用.由于分子天然可以表示为图结构,许多基于图的模型被广泛应用于该任务.随着分子空间的迅速扩展,基于图的方法正面临巨大的计算挑战,模型轻量化对于提升预测速度和效率至关重要.然而,现有的解决方案仍然较为有限,难以在保持预测性能的同时显著提高推理效率.提出一种新颖的双层模型轻量化方法LW⁃MPP,首先引入一种新的知识蒸馏框架,将大规模基于图的模型转换为更小更高效的基于SMILES的模型;其次,应用一种训练后剪枝技术,结合掩码搜索和重排序方法,进一步优化模型的推理效率.在大规模PCQM4M⁃LSC数据集上的基准测试结果表明,与传统基于图的模型相比,提出的方法实现了3.82~17倍的推理加速,同时保持了接近最优的性能,并优于大多数基于SMILES⁃Transformer的模型.当应用于MoleculeNet中小规模数据集的特定下游任务时,提出的模型在大多数情况下均实现了最佳的预测准确率.

%U https://jns.nju.edu.cn/CN/10.13232/j.cnki.jnju.2025.06.006