材料科学大语言模型关键技术及其应用
罗丹宇1,2,3,温李阳4,陈博4,郭思佳1,汪华洋1,万紫平4,陈露1,4,陈忻4(1.上海交通大学计算机学院跨媒体语言智能实验室;2.人工智能教育部重点实验室和上海交通大学人工智能研究院;3.江苏省语言计算及应用重点实验室;4.苏州实验室)
摘要:大语言模型近年来受到广泛关注, 并逐步发展为材料科学领域的重要研究工具. 相较于传统机器学习方法, 大语言模型能够实现材料科学领域多种任务协同处理, 进行跨模态语义理解, 并实现全流程智能化覆盖. 本文系统梳理了大语言模型在材料领域知识增强、多模态数据融合以及工具协同调用方向的最新进展, 阐述了大语言模型推动材料研发流程从局部智能化向全流程智能化的技术演进. 本文进一步探讨大语言模型应用于材料领域面临的核心挑战, 包括领域特定知识深度与指令泛化能力的平衡机制、跨模态语义精确对齐方法、工具调用精确度与模型自学习能力的提升策略, 以及学术研究与工业界需求间的矛盾, 最终为构建材料科学专用大语言模型的技术创新与应用落地提供了理论框架和发展建议.
关键词:大语言模型, 材料科学, 多模态, 智能体
目录介绍
1 引言
2 大语言模型中的材料领域知识增强
2.1 自监督预训练
2.2 指令微调
2.3 基于强化学习的偏好对齐
3 大语言模型中的材料领域多模态数据融合
3.1 分子结构
3.1.1 分子符号序列
3.1.2 分子平面结构
3.1.3 分子空间构型
3.2 视觉图片
3.3 晶体结构
3.4 谱图
4 大语言模型中的材料领域工具调用
4.1 结构化知识构建和检索
4.2 计算工具链与专家系统协同
4.3 自主实验系统
5 大语言模型在材料研发中的应用
6 总结与展望
©软件著作权归作者所有。本站所有文件均来源于网络,仅供学习使用,请支持正版!
转载请注明出处!

发表评论 取消回复