加入五千万化工人社群
您需要 登录 才可以下载或查看,没有账号?注册
x
本帖最后由 麦片 于 2025-2-19 10:50 编辑
目前端口仅限于内测使用
什么是「化学与催化」本地知识库?
「化学与催化智库」是基于DeepSeek开源的大语言模型LLM培养的化学与催化领域专项的本地知识库。我们通过大量的化学与催化相关文献与实验数据,自主训练了AI深度学习模型,打造了安全可控的本地知识库系统,让Al成为真正的催化专家。
从有机化学理论基础到固态催化剂的实验数据,「化学与催化智库」涵盖基础化学书籍、顶级期刊、催化剂性能数据集等海量专业数据。系统属于私有化部署,完全本地化加密运行,不涵盖企业机构的专利配方和敏感数据。培育后的大语言模型LLM「化学与催化智库」在化学任务中表现卓越,尤其适用于简化实验决策、预测反应过程、筛选催化剂等。
本地知识库是如何形成的?
我们通过RAG整合专业化学和材料知识库来增强大语言模型(LLM),它允许LLM引用权威化学知识库和内部催化数据,从而生成针对催化剂领域的量身定制的输出。RAG无需重新训练大语言模型即可实现此类增强,是一种经济高效的解决方案。
碳明科技本地知识库训练方式
「化学与催化智库」的特点是什么?基于大语言模型的「化学与催化智库」能够直接提取与学习非结构化数据(如文献文本、实验记录、专利描述)和半结构化数据(如表格、图表),无需依赖人工提取。传统数学模型需依赖结构化输入(如吸附能、键长、电子结构参数),而大语言模型可以自动从海量文献中挖掘潜在关联(如材料组成、反应条件、催化剂性能)。
基于大语言模型LLM的学习,可以将知识运用于不同的反应体系。而传统的数学模型针对不同体系需要重新建模。
「化学与催化智库」可通过学习不同专业的知识(化学、材料学、工程学等)发现隐性的科学规律。例如,某些催化剂的“非传统”活性位点可能被数学模型忽略,但LLM可通过文献中实验现象的关联推测其作用。
LLM可基于历史数据快速生成候选催化剂列表(如预测元素掺杂方案),大幅度缩短实验周期。传统方法。传统方法DFT(如密度泛函数理论计算)需高昂的算力,单次模拟耗时数小时至数天。
我们将如何迭代?
大语言模型与数学模型的结合可以更精准的预测材料性质与反应路径。DFT主要用于计算材料的电子结构,对于催化来说,通常用来研究催化剂表面的吸附能、反应路径、过渡态等等。支持DFT计算结果导入,可根据特定催化剂载体构建专属预测模型,进一步助力催化剂的开发与应用。
未来「化学与催化智库」会针对垂直领域进行定向培养,例如绿色化学方向。符合碳中和趋势,聚焦绿色化学相关固态催化剂的开发,例如:CO2的综合利用催化剂、电池电解液添加剂、绿色加氢(贵金属催化剂的替代)。
|