科学家发布材料合成大语言模型MatChat

发布时间:2023-11-01 09:51:24 浏览:205次

       材料合成路径预测是物质科学领域的重要课题。近年来,大语言模型的崛起以及预训练-微调方法的应用,使得通用大语言模型的理解能力在各垂直领域展现出潜力,但在材料领域缺乏相关的应用和研究。

近期,中国科学院计算机网络信息中心人工智能部和物理研究所SF10组合作,通过使用来自400多万篇论文中提取的35675个无机材料固相反应合成过程,将数据处理为13878条高可信度的合成路径描述数据,并对开源大语言模型LLaMA2-7B进行微调训练,研发了专注于无机材料合成路径预测任务的大语言模型——MatChat(http://chat.aicnic.cn/onchat)。目前,该模型已上线运行并开放使用。

该模型基本具备材料合成领域知识的生成和推理能力。经实验验证,该模型在预测合成复杂的无机材料时,具备超过ChatGPT的性能表现。受限于数据集的数量和质量,该成果仍需要更多的语料以满足不同材料设计的需求,但展现出大模型在材料领域的创新潜力和应用空间,为材料研究和创新带来了新的启发和思路。

相关研究成果发表在《中国物理B》(Chinese Physics B)上。研究工作得到中国科学院网信专项应用示范项目的支持。

 

消息来源:中国科学院官网

全国服务热线010-62579648

电话:010-62579648 邮箱:yuwenping666@163.com
注册地址:北京市延庆区中关村延庆园东环路2号694室
办公地址:北京市海淀区中关村北二条13号中科科仪1号楼509室
实验基地:北京市房山区燕山东风街道岗北路2号院56号楼
北京中科纯金科技有限公司 © 2022-2023 京ICP备2022016013号-1

京公网11010802040045号

 

扫一扫关注我们