金磊 发自 北京798
量子位 | 公众号 QbitAI
一个年仅9岁的男孩,利用AI智能体,竟然出版了一本书!
他叫许萌萌,是来自北京市第二实验小学的一名三年级学生。
萌萌与AI智能体共创的书叫做《AI少年——火星生存大挑战》,是一本科普小说,讲述了发生在火星上的“密室逃脱”的故事。
而他所选用的AI,正是来自智谱AI的智谱清言。
至于这本书具体是如何跟AI共创的,萌萌也做了详细地介绍:
我先问了智谱清言如何才能在火星上生存,确定了氧气、水、食物和能源是最重要的问题,确定了这本书的章节框架。
然后我会分段落告诉智谱清言我脑子里的故事情节,有时候会请他整段帮我撰写,比如科技馆的外观,火星的地貌等,有时候我需要智谱清言帮我查询科学知识和做一些计算,比如栖息舱的火星经纬度,找到祝融号的时间等。
最后,我还请智谱清言帮我修饰文字和改正错误,后来编辑老师表扬我的稿件几乎没有语法错误,这其实是智谱清言的功劳。
这便是智谱AI在今天刚刚举行的Open Day活动中所展示的较为有趣的环节。
对此,智谱AI CEO张鹏在现场总结道:
现在是到了把大模型技术的想象力转化为全新生产力的时刻,唯有如此AI才具有真正的革命性的意义。
而纵观整场活动,我们发现作为国内大模型顶流之一的智谱AI,围绕AI智能体、张鹏的观点,又有了新的发布动作:
- 清言flow(清流):一个“@”动作,就可以联动数个AI智能体协作,其中还有一个“罗永浩”的官方智能体教你卖货(彩蛋见文末)。
- MaaS开放平台2.0:能力上去了,价格又打下来了。
接下来,我们就来一同看下,最新的智谱清言能帮我们做些什么。
一个“@”联动AI智能体,每天速读100篇论文
首先就是这次活动的主角之一,清流,正如刚才我们所述,它的可以让用户在GLM-4主对话框或任意一个AI智能体内,只需使用“@”功能,就可以召唤不同的专用AI智能体继续执行任务。
这些AI智能体可以自由组合,形成个性化工作流,以此来提高工作效率。
那么对于天下苦久矣的“读AI论文”这件事,智谱清言的AI智能体是否能帮上忙呢?
毕竟谷歌AI负责人Jeff Dean早在数年前就做过统计,单是在ML领域,每天就会产生超过100篇新论文。
平均三分钟速览一篇,一天也得看上个5个小时。
这个“产速”当年就已经超过了摩尔定律,再加上现在爆火的大模型……读不完,根本读不完!
而现在,有了智谱清言的AI智能体,就能开启“用魔法打败魔法”的模式。
例如我们可以@一下一个名叫“arXiv论文速读/精析(计算机)”的AI智能体:
推荐5篇视频大模型最新进展的论文。
“唰唰唰”,在arXiv上与视频大模型相关的最新五篇论文就整理好了,而且是题目、作者、摘要、日期、链接等一并奉上的那种。
(AI智能体:大郎~该喝药……读论文了)
如果想继续深挖某个论文,我们就可以继续用@的方式调用另一个AI智能体来帮忙,例如**“论文解读助手”:
再如下面这个名叫“论文推荐助手”的AI智能体,更是可以检索清华大学AMiner数据库中,近三年超过600万篇的优质论文。
这次我们提一个概括总结性的问题:
关于机器学习的最新研究有哪些突破?
这个AI智能体从今年的各大研究中精准提炼出了“多模态”和“Agent”这两个概念,正是今年的大热门。
如此一来,有了AI智能体们的加持,一天速读100篇论文就不再是什么难事了。
除了读论文这件事,智谱AI在现场还展示了其它AI智能体联动的案例,主打的就是实现“跨部门协作”。
例如“喂”给智谱清言一个5分钟的讲义PPT,让它先生成一个讲义大纲:
然后再@一下“复杂流程图”这个AI智能体,就能把讲义大纲一键转成流程图了:
再如搞个活动策划,现在有了清流,相当于给你配备了多个助理。
我们先向“PPT助手”这个AI智能体提出需求:
我要策划一个线下音乐节,帮我写一个策划方案,格式要方便阅读。
当然,即便是AI,方案一次性通过的概率也是不大,这时候我们可以继续在上面这个AI智能体对话框中,@一下另一位AI智能体“活动方案策划达人”来交叉验证一下:
你觉得这个方案有什么问题吗?
可以看到,“活动方案策划达人”在第一版的基础之上又做了进一步的优化工作。
最后,我们就可以要求“PPT助手”基于优化的版本,来生成PPT了:
根据上述内容生成一个方案PPT。
不过有一说一,我们现在所熟知的多数AI聊天机器人,依旧是以prompt为驱动,也就是用户问一句,AI就会答一句。
而AI智能体的运作方式则是更具自主性,我们只需给出一个任务目标,它就能一步一步去完成工作。
但现实中的问题往往错综复杂,即便AI智能体能够胜任某个单一的工作,但若对于解决“复合型问题”来说依然存在挑战。
这也正是智谱AI的清流功能要啃下的硬骨头。
如Andrej Karpathy就不止一次的在公开演讲中表达过这个观点,并且他还认为:
AGI在形式上将具备AI Agents的某些特性;这不仅仅是一个AI智能体的事情,而是需要很多的AI智能体共同联动。
OpenDay上,智谱清言还介绍了一个新的功能。知识库,还是可以构建“挂载”超大知识库的AI智能体功能——足足可以hold住100000000(1亿)个字的那种。
我们现在就不妨在亲测一下效果。例如我们上传100篇存在本地的文件(一次可上传50个):
从上传到解析完毕,也就是不到1分钟的事。
并且基于此,我们就可以提一些更有针对性、更符合自己需求的问题,例如:
今天的LLM论文中有哪些关于开源方面的内容?
不仅如此,“上传URL”和“上传文件”,还可以一起联动。
在调试到自己满意为止之后,点击页面右上角“发布智能体”,就可以上架到智谱清言的智能体广场了。
而除了应用上的更新之外,智谱AI在这次的Open Day中在模型层上同样也有新动作。
第四代开源模型GLM-4-9B
GLM-4-9B,正是智谱AI此次带来的最新开源大模型,亮点如下:
- 更强的基础能力
- 更长的上下文
- 有更精准的函数调用和All Tools能力
- 首次拥有多模态能力
有多强?我们不妨先来看下榜单性能。
整体来看,GLM-4-9B的中英文综合性能相比ChatGLM3-6B足足提升了40%!
对比训练量更多的Llama-3-8B模型,可以说是做到了全面超越,中文学科方面更是有着高达50%的提升。
不仅如此,从多语言能力、函数调用、多模态能力的评测上来看,GLM-4-9B也有不小的提升。
尤其是在多模态方面,是已经可以比肩GPT-4V了!
而且在长文本上下文窗口上,GLM-4-9B更是从128K扩展到了1M之多。
什么概念?相当于一口气可以消化2本红楼梦和125篇论文的文字量!
同样的,通过测试表明,GLM-4V-9B在1M大海捞针任务中取得了全绿的佳绩。
接下来,我们看实测效果。
例如“喂”给它一个公式印花的T恤,即便有褶皱这样的“阻力”,GLM-4V-9B也可以精准识别出是麦克斯韦方程组。
再如把《三体》前三部(约90万字)内容丢进去,GLM-4-9B可以轻松基于此给出第四部的合理提纲。
而除了模型本身之外,智谱AI开放平台也有了新的升级——MaaS开放平台步入2.0时代。
在模型方面,智谱AI主打的就是“发布即上线”,包括刚才新发布的GLM-4-9B等,全部都已经集成到了平台当中。
并且GLM-4全系列都是无需代码,三步完成微调的那种(支持LoRA微调和全参微调),操作上也是相当的简单。
但最为吸睛的,还应当是价格上的调整,来感受一下这个feel:
以GLM-4-Air为例,目前只需1%的价格,在性能上就可以比肩GLM-4了!
不得不说,智谱AI又一次把大模型“多快好省”的用起来这件事狠狠地push了一把。
而这也是整场活动看下来后最为直观的感受。
并且据智谱AI CEO张鹏介绍:
自从新一代基座大模型GLM-4问世以来,已经有超过30万个智能体活跃在清言APP的智能体中心上,其中包括了许多出色的生产力工具,比如思维导图、文档助手、日程安排等等。
One More Thing
其实在这场活动中,除了我们最开始提到的萌萌小朋友用AI进行了创作之外,现场还展示了众多的画作:
这些画作同样是小朋友们用智谱清言APP创作而来,并且他们岁数最小的只有1岁半,最大的也不超过12岁。
这代表了一种大模型应用普惠的趋势,也意味着大模型带来的人类能力增强,年龄下探、能力门槛几乎为0、人机交互也不必再专门学习相应的计算机语言。
学习AI,比之前所有其他科目和技能的学习,都更重要。
最后的最后,就是揭秘罗永浩彩蛋的时候了,AI老罗成为其清言平台的首位数字员工,工号001,并在智谱清言上向公众开放。罗永浩说自己也在玩。
他在录制的视频中也给予了智谱清言高度的肯定:
知识面渊博,说话中肯,找不到我的时候,找它也是可以的!
视频地址:https://mp.weixin.qq.com/s/CcY91oXIdP9-sBhnyLSn2A
除此之外,刘慈欣也和智能体来了个梦回联动。
嗯,这次智谱AI的Open Day是有点fancy在身上的。