材料信息学—–数据驱动的材料研发

2022-11-19 07:13张统一
关键词:高通量信息学X射线

张统一

(上海大学材料基因组工程研究院,上海200444)

材料信息学是材料基因工程的核心,也是材料研发的新范式.它利用在材料集成计算、高通量实验和大数据科学方面的最新技术,将材料科学与工程和人工智能、机器学习无缝集成.在国家重点研发计划、上海市科委科研计划、上海市Ⅳ类高峰学科、云南省材料基因重大科技专项、之江实验室科技攻关项目等支持下,上海大学牵头联合国内高校、科研院所和企业,在材料高通量计算、高通量实验、材料基因组工程专用数据库、机器学习,以及材料信息学领域开展了深入而系统的研究.特别是钱权教授作为项目负责人的国家重点研发计划——材料基因组工程专用数据库项目,聚焦铝基复合材料、陶瓷涂层、非调质特殊钢等示范材料,全面地发展了利用数据科学方法对材料“成分-工艺-结构-性能”内在关系进行挖掘的材料信息学,取得了一系列成果.值此上海大学建校100周年之际,钱权教授领导项目组围绕材料信息学和数据驱动材料研发,对科研成果进行梳理,形成了本专辑3个板块内的系列文章.

数据采集、数据库和数据处理组成了本专辑的第一板块.材料信息学是数据驱动的材料科学和工程,数据是基础.《基于Jaya优化标定的高精度数据采集方法》报道了从材料设备中采集高精度数据的方法和系统.材料领域的文献包含了海量数据,《结合上下文词汇匹配和图卷积的材料数据命名实体识别》和《基于自然语言处理的材料领域知识图谱构建方法》结合了自然语言处理和图神经网络、递归神经网络、条件随机场等多种深度学习算法,能够从材料文献中自动抽取材料实体、关系等领域知识构建知识图谱.《材料基因组工程专用数据库》和《基于区块链的数据版权保护与组合竞拍》发展了材料数据规范化表示、机器学习模型跨域部署、材料数据隐私保护和基于本体的材料数据语义集成等材料基因数据库的关键技术,并结合区块链、数字水印和组合竞拍技术发展了材料数据版权保护的方法和系统.材料数据有3个特点:小样本、高维度、大噪声.《基于卡尔曼滤波的含噪声小样本数据处理方法》将经验模型与实验观测数据相结合,采用了卡尔曼和扩展卡尔曼滤波对小样本数据去噪;《聚丙烯复合材料老化数据集成学习》用高斯混合模型结合数据采样方法进行数据增强;《小样本分散数据的回归建模和多目标优化》采用高斯过程和多目标优化对小样本分散数据集进行回归建模,通过预测结果的不确定性估计指导材料逆向设计.

机器学习是材料信息学的核心,组成了本专辑的第二板块.特征和特征空间是机器学习两个主要和基础问题,《基于强化学习的特征选择方法及材料学应用》研究了基于强化学习的包装式特征选择方法,将特征选择抽象成智能体与环境交互的收益最大化问题;《基于特征工程和机器学习的铝基高熵合金稳定性预测》采用特征工程和机器学习对高熵合金的相稳定性进行了预测.支持向量机是常用的一种机器学习算法,《支持向量回归预测不锈钢的点蚀电位》报道了支持向量机回归预测不锈钢的点蚀电位的研究.《陶瓷涂层材料多模态数据表征学习》融合结构化工艺数据和非结构化微结构图像数据进行了多模态学习.《面向复合材料带隙预测的两段式集成学习模型构建》采用集成学习利用多个弱分类器的集成来提升模型预测精度.《数据驱动的铝基复合材料性能预测和逆向设计》采用超参自动寻优来选择模型,并利用虚拟样本来进行逆向设计和实验验证.

第三板块包含了材料微结构图像识别与材料微结构分析.《基于数字图像处理技术的热障涂层形貌特征识别方法》和《基于轻量级网络的防伪标签检测算法》采用了数字图像处理中的形态学方法,结合协调注意力机制的卷积神经网络进行了材料微结构形貌特征的识别和分析.《稀土掺杂热障涂层材料分立成分样品的高通量X射线表征》和《La1-xSrxTiO3薄膜的高通量X射线衍射》通过X射线源高精度x-y二维平面快速移动,研发了高通量的X射线表征系统并在两种材料上进行测试验证.《含碲非调质钢38MnVS6水口结瘤成因分析》对非调质钢的水口结瘤成因进行深入研究.

材料信息学是一门极热的交叉研究领域,近来进展极快,已涌现出大批优秀的科研成果、研究机构和研究人员.希望本专辑能抛砖引玉,进一步推动材料数据库、高通量制备与表征技术、高通量计算与模拟、材料数字孪生、挖掘与学习等研究的发展,早日把我国建设成材料基因工程、材料信息学和材料强国.

猜你喜欢
高通量信息学X射线
基于生物信息学分析多发性肌炎的关键基因及发病机制
基于生物信息学分析慢性荨麻疹的关键基因及分子机制
高通量卫星服务专用网络的应用模式探索
高通量血液透析治疗老年慢性肾衰竭对治疗有效率、Hb及ALB指标的影响研究
新一代高通量二代测序技术诊断耐药结核病的临床意义
高通量卫星通信综述
X射线
天鹅座X-1——最容易看到的黑洞迹象
为何可以通过X射线看穿人体?
X射线下的奇妙世界