科学研究

郑育宇:基于机器学习方法和磷灰石地球化学的岩石含矿性判别模型【AM,2025】
2025-01-06 阅读:79

磷灰石是一种优秀的抗性指示矿物,也是三大岩类中广泛存在的副矿物。得益于其晶格内元素的广谱性,磷灰石的微量元素和同位素可以表征各种成矿环境和揭示岩浆的起源和演化。因此,磷灰石的微量元素和一系列地球化学指标如Sr/YEu/Eu*Th/UV/Y Cl/F等常用于判别围岩岩性、岩石含矿性、矿床类型和流体来源。但随着对磷灰石的研究深入和海量的主微量元素数据的公布,传统的低维度投图逐渐失效,投点大面积重叠,准确率仅在24.2% ~ 55.3%,在岩石含矿性判别上具有明显局限性。

针对上述问题,中国地质大学(北京)珠宝学院博士研究生郑育宇在许博教授的指导下,搜集并清洗了来自 27个国家241个地区(图1)的磷灰石地球化学数据,建立了完善的数据搜集清洗流程和结构化的磷灰石地球化学数据库,并基于该数据库选用多种机器学习方法(XGBoost、支持向量机和随机森林)进行高维度挖掘分析,取得以下认识:

三种机器学习方法中XGBoost对磷灰石地球化学数据集的判别和预测结果最优秀。14XGBoost含矿性判别模型中,对测试集的预测准确率最高可达99.18%F1分数可达99.39%(图2)。使用该高性能模型对未标签化的特提斯带12个岩套中的磷灰石成分数据进行含矿性预测(图3),每个岩体的含矿可能性都被准确识别,预测结果再次证明了该模型对于未知岩石样品进行含矿性判别的鲁棒性。

模型的特征重要性分析表明表明磷灰石的Cl/FSr/Y(Ce/Yb)NV/Y等地化参数以及ClFS等挥发分含量在模型中占据较高权重,是区分是否含矿的关键参数。这些特征与成矿过程中氯、硫和水的富集密切相关,表明富含挥发分的岩浆是金属迁移、富集和成矿的关键因素。


图 1 磷灰石数据库的样品来源分布



图2 四个具有代表性的 XGBoost 模型的混淆矩阵(左侧)和特征重要性排名(右侧),混淆矩阵显示每个类的预测结果



图3 验证数据集的分布模式以及模型 M-T-5的预测结果;(a)使用主成分分析(PCA)对训练数据集和验证数据集进行降维后的分布模式;(b)验证集中每个岩套的含矿性预测结果;(c-f)四个有代表性的岩套的成矿概率预测


上述成果受国家自然科学基金(4222230442073038)的支持,发表在国际矿物学领域权威期刊《American Mineralogist》上,论文信息Yu-yu Zheng, Bo Xu, David R. Lentz, Xiao-yan Yu, Zeng-qian Hou, Tao Wang; Machine learning applied to apatite compositions for determining mineralization potential. American Mineralogist 2024, 109 (8): 1394-1405.

全文链接:https://doi.org/10.2138/am-2023-9115