数据驱动研究范式下材料数据库的构建与应用
摘要:近年来, 随着大数据和人工智能技术的发展, 数据驱动的材料研发范式在材料构效关系挖掘和新材料设计与筛选等方面展现出显著优势. 数据作为此研究范式的基础, 在拓展材料设计空间和提升人工智能模型性能方面具有重要意义. 因此, 构建高质量材料数据库是数据驱动材料研发的重要一环. 自“材料基因组计划”启动以来, 理论数据库和实验数据库的数量和规模持续扩大, 数据基础设施和大数据技术也得到了充分发展. 本文围绕数据驱动研究范式下的材料数据库构建展开讨论, 首先从数据生成、数据预处理、数据存储和数据访问4个方面出发重点叙述了数据库构建的主要步骤, 然后基于数据体量、数据种类、访问方式和数据库特色等方面对国内外具有代表性的材料数据库进行总结, 最后从材料数据本身和数据基础设施建设两个视角出发, 对材料数据库未来的发展进行展望.





