数据驱动研究范式下材料数据库的构建与应用
封俊杰, 周琨, 李木琛, 王新江, 张立军 (吉林大学材料科学与工程学院, 集成光电子学国家重点实验室, 汽车材料教育部重点实验室, 物质模拟方法与软件教育部重点实验室)
摘要:近年来, 随着大数据和人工智能技术的发展, 数据驱动的材料研发范式在材料构效关系挖掘和新材料设计与筛选等方面展现出显著优势. 数据作为此研究范式的基础, 在拓展材料设计空间和提升人工智能模型性能方面具有重要意义. 因此, 构建高质量材料数据库是数据驱动材料研发的重要一环. 自“材料基因组计划”启动以来, 理论数据库和实验数据库的数量和规模持续扩大, 数据基础设施和大数据技术也得到了充分发展. 本文围绕数据驱动研究范式下的材料数据库构建展开讨论, 首先从数据生成、数据预处理、数据存储和数据访问4个方面出发重点叙述了数据库构建的主要步骤, 然后基于数据体量、数据种类、访问方式和数据库特色等方面对国内外具有代表性的材料数据库进行总结, 最后从材料数据本身和数据基础设施建设两个视角出发, 对材料数据库未来的发展进行展望.
关键词:数据库构建, 新材料设计, 材料基因工程, 机器学习
目录介绍
1 材料数据库构建
1.1 数据生成
1.1.1 高通量计算
1.1.2 高通量实验
1.1.3 其他方法
1.2 数据预处理
1.2.1 数据标准化
1.2.2 数据筛选
1.3 数据存储
1.3.1 基于关系型数据库的数据存储
1.3.2 基于非关系型数据库的数据存储
1.4 数据访问
1.4.1 在线访问
1.4.2 离线访问
2 国内外常用材料数据库
2.1 实验数据库
2.2 理论数据库
2.3 实验-理论数据库
3 总结与展望
©软件著作权归作者所有。本站所有文件均来源于网络,仅供学习使用,请支持正版!
转载请注明出处!

发表评论 取消回复