在材料科学领域,机器学习已成为加速材料性能预测和筛选的重要工具。然而,小数据集问题严重制约了模型的泛化能力。针对这一挑战,昆明理工大学材料科学与工程学院种晓宇、何京津、冯晶教授团队创新性地提出了“连续迁移”框架,通过迁移学习策略实现多性能协同预测,为小数据集条件下的材料性能预测建模提供了新思路。
该框架首先基于形成能数据建立高精度源域模型,随后依次通过迁移学习预测Ehull、带隙、体积模量和剪切模量。针对剪切模量小数据量(仅有51条)导致模型预测性能不足的问题,团队创新性地提出连续迁移方法,使用体积模量模型再次作为新源域,进一步迁移至剪切模量模型,优化模型预测性能,显著提升了小数据集条件下的模型可靠性。这一方法有效解决了传统机器学习在数据稀缺场景下的性能瓶颈,为材料多性能协同优化提供了高效计算范式。
基于该方法,团队成功从18040种候选材料中筛选出54种兼具高稳定性和优异延展性的无机双钙钛矿涂层材料,其中Cs2CuIrF6不仅具有良好的稳定性,还拥有适合光伏应用的带隙(1.06 eV)和高延展性(G/B = 0.27),验证了连续迁移学习在材料设计中的普适性。该研究不仅为小数据集机器学习建模提供了新策略,也为其他材料的性能预测与优化提供了可推广的框架。

图1 基于迁移学习的多性质筛选框架
相关研究成果以"Accelerated multi-property screening of lead-free halide double perovskite via transfer learning"为题,发表于材料科学领域顶级期刊《Advanced Functional Materials》。论文的第一作者为昆明理工大学材料学院和金属先进凝固成形及装备技术国地联合工程研究中心2022级硕士研究生魏毅炜,通讯作者为何京津和种晓宇教授,冯晶教授和刘兴军教授为论文的共同作者,昆明理工大学为论文的唯一作者单位。全文链接:https://doi.org/10.1002/adfm.202514377
(供稿:材料学院)