AI+化学|中科大江俊团队自主研发Chem-GPT,化学领域的聊天机器人

2,005次阅读
没有评论

编辑 | 紫罗

近日,中国科学技术大学化学与材料科学学院江俊团队自主研发 Chem-GPT——一款化学领域的聊天机器人程序。

Chem-GPT 由化学数据驱动,并结合人类化学家的知识进行机器学习训练,能够针对使用者提出的问题,给出初步的实验建议。基于开源的 GPT 代码,目前阅读了 50 万化学论文,可以基于论文知识来回答化学问题、建议实验方案,驱动机器化学家「小来」做实验,解决化学品和新材料的研发问题。

AI+化学|中科大江俊团队自主研发Chem-GPT,化学领域的聊天机器人

Chem-GPT 通过阅读 50 万篇化学论文,响应使用者提出的化学问题。

1. 大胆假设:基于文献数据,给出初步实验建议;

2. 小心求证:驱动机器化学家「小来」做实验与模拟;

3. 精准预测:针对实验与理论数据归纳总结;

4. 解决问题反馈优化方案驱动实验验证。

以芬顿催化剂为例

Fenton(芬顿)是众多的以人名命名的无机化学反应之一。

芬顿反应是一种无机化学反应,过程是过氧化氢(H2O2) 与二价铁离子 Fe2+ 的混合溶液将很多已知的有机化合物如羧酸、醇、酯类氧化为无机态。反应具有去除难降解有机污染物的高能力,在印染废水、含油废水、含酚废水、焦化废水、含硝基苯废水、二苯胺废水等废水处理中有很广泛的应用。

芬顿催化剂又叫芬顿催化氧化填料,芬顿填料,它在传统芬顿反应的基础上,将芬顿反应所需的铁氧化物通过特殊方法附着在载体表面,形成有效的芬顿催化剂。

问:什么类型的非贵金属元素常用于芬顿催化剂?

Chem-GPT 的结果其实就来自于江俊团队开发的化学文献机器阅读系统,该系统内置了自然语言处理模型,通过阅读数千篇芬顿催化剂相关文献,可以很快统计出文献中出现频次最多的非贵金属元素。

AI+化学|中科大江俊团队自主研发Chem-GPT,化学领域的聊天机器人

化学文献机器阅读系统。

AI+化学|中科大江俊团队自主研发Chem-GPT,化学领域的聊天机器人

文献中出现频次最多的非贵金属元素。

除了对数量进行统计,该系统还能进行元素协同分析来帮助我们选择最佳的元素组合。

AI+化学|中科大江俊团队自主研发Chem-GPT,化学领域的聊天机器人

最佳的元素组合。

Chem-GPT 能从文献的精确分析中学习到正确的知识,并不是仅仅基于语言的关联性,因此它给出的答案保证了严谨与准确性。

接下来,就可以调出机器化学家操作系统中保存的芬顿催化剂实验模板,并根据 Chem-GPT 推荐的元素组合编辑液体进样站的参数,让机器获取家小来帮助我们进行实验验证。

AI+化学|中科大江俊团队自主研发Chem-GPT,化学领域的聊天机器人

就这样,小来开始了愉快的芬顿催化剂创制之旅。

化学文献机器阅读系统

化学文献机器阅读系统基于 Word2Vec 与机器学习算法,结合语法距离分析方法,根据关键词,从文献中抽取化学关系,包括 Alloy 和 Organic molecule 两种任务。程序使用说明如下:

1. 数据准备:目前系统支持两种格式数据:一是 TSV 文件格式,需要从 Web of Science 网站上下载,方法如下:进入 Web of Science 网站,根据关键词检索文献后,以制表符分隔符的形式导出,具体步骤见下图所示。

AI+化学|中科大江俊团队自主研发Chem-GPT,化学领域的聊天机器人

AI+化学|中科大江俊团队自主研发Chem-GPT,化学领域的聊天机器人

AI+化学|中科大江俊团队自主研发Chem-GPT,化学领域的聊天机器人

二是 PDF 格式文件格式,支持任意 PDF 格式论文。

2. 数据准备完成后,点击页面新建任务按钮,进入新建任务页面;

3. 在新建任务页中填写任务名称、抽取的分子类型、上传准备的数据、填写关键词信息,其中点击可添加多个关键字; 当抽取的任务类型为 ALLOY 时,需指定目标元素在元素周期表上的周期,当需抽取的任务类型为有机分子, 则无需选择。

4. 填写完成后,提交任务,等待任务排队完成,即可获取最终化学关系抽取结果。

机器化学家

2021 年 6 月,在 2021 北京智源大会《科学智能》专题论坛上。中国科学技术大学化学物理系江俊教授作了题为「分子光谱与材料构效关系的机器学习研究」的演讲。

江俊表示:「上个月,中国科学技术大学研究人员提出「机器化学家」这个概念。我从鄂维南院士提出的『AI for Science——从理论模型得到可靠的数据,再从数据得到有效的模型』得到了启示,修改了我之前的思路,并拿到了项目。」「机器化学家」将帮助人类科学家突破思维局限,从融合了底层规则的数据中,学习建立有效的复杂模型,指导化学实践。

就在项目启动一年后,在中国科学院「数据驱动的化学、材料和生物科学的机器科学家」青年团队计划和国家自然科学基金委项目的资助下,江俊教授团队通过开发和集成移动机器人、化学工作站、智能操作系统、科学数据库,研制出数据智能驱动的全流程机器化学家。

这个神奇的「机器化学家」是全球首个数据智能驱动的全流程机器化学家平台。

当然,「机器化学家」并只是一年就可以完成的,这是中国科学技术大学化学与材料科学学院教授罗毅、江俊团队经过八年攻关研制出的。

相关研究成果以「An all-round AI-Chemist with a scientific mind」为题,于 2022 年 9 月发表在《国家科学评论》(Natl.Sci.Rev.)上。

AI+化学|中科大江俊团队自主研发Chem-GPT,化学领域的聊天机器人

论文链接:https://academic.oup.com/nsr/article/9/10/nwac190/6694008 

「机器化学家」由「化学大脑」、机器人实验员和智能化学工作站三部分组成。其中最核心的「化学大脑」通过分析大量化学实验和理论数据建立知识图谱,实现了阅读理解文献、设计化学实验、自主优化方案的能力,并配备了人机交互的操作系统,可以便于「无编程基础」的科研用户使用。机器人实验员和 16 个化学工作站之间能进行数据交换和互动,精准配合执行化学实验。

业内专家认为,机器化学家的研究工作脱离了传统试错研究范式的限制,展现出「最强化学大脑」指导的智能新范式的巨大优势,引领化学研究朝着知识理解数字化、实验操作指令化、材料创制模板化的未来趋势前进,确立了我国在智能化学创新领域的全球领跑地位。

AI+化学|中科大江俊团队自主研发Chem-GPT,化学领域的聊天机器人

全球首个数据智能驱动的全流程机器化学家。

就在本月,江俊团队首次将数据驱动自动合成、机器人辅助可控合成、机器学习促进逆向设计,用于胶体纳米晶(例如钙钛矿)材料合成,探索构建了「机器科学家」平台,有望将科研人员从传统试错实验、劳动密集型表征中解放,聚焦科学创新,实现纳米晶材料数字智造。

该研究以「A robotic platform for the synthesis of colloidal nanocrystals」为题,于 2023 年 3 月 2 日发布在《自然-合成》(Nature Synthesis)上。

AI+化学|中科大江俊团队自主研发Chem-GPT,化学领域的聊天机器人

论文链接:https://www.nature.com/articles/s44160-023-00250-5 

「这主要得益于中国科大多学科交叉的背景,促使不同学科的科研人员汇集在一起共同做一件事。我们的目标是建成机器化学家大科学装置,解放化学家双手,加快新的化学品和新的材料研发创制。」江俊教授说。

未来蓝图:改变传统化学研究范式,解放化学家双手

对于未来,江俊教授希望他们可以建成一个「机器化学家」大科学装置:在一整栋大楼里,布置上百个机器人、上千个智能化学工作站。一边,全国的化学家、材料学家只需在网上提交自己的任务;另一边,团队成员通过智能操作系统分时安排机器人完成任务,最后将方案反馈给化学家们。

基于这样一个大平台,各个课题组的实验数据可以交汇、共享,产生海量数据,实现自动提炼出数字化的知识图谱和人工智能的模型,进而指导机器人自动优化产生更好、更高效率的化学品或新材料。而且在完成各个实验过程中,机器人通过与科研人员互动,默默学习人类的操作逻辑、思维模式,很有可能在若干年之后,机器人会变成一个智能、创造力都比肩大学教授的机器化学家。

「我们希望争取到国家的支持,在 2 至 3 年内建成拥有几十台机器人的小型装置,3 至 5 年后建成一个大科学装置。在这期间,我们还需要不断训练机器人和智能化学通用模型。」江俊教授规划着未来的研究蓝图。他们最终目标是改变传统化学研究范式,解放化学家双手。

化学文献机器阅读系统:
http://dcaiku.com:10010/#/home 
参考内容:
http://staff.ustc.edu.cn/~jiangj1/ChemGPT-Leo.mp4 
https://baike.baidu.com/item/%E8%8A%AC%E9%A1%BF%E5%8F%8D%E5%BA%94/6601093 
https://dcp.ustc.edu.cn/2022/1010/c4481a574991/page.htm 
https://mp.weixin.qq.com/s/ZzFbW5jgRpVBmy3OSyZyLwhttps://faculty.ustc.edu.cn/jiangjun1/zh_CN/zdylm/661326/list/index.htm 

 

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 3 月
 12345
6789101112
13141516171819
20212223242526
2728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...