AI治理必修9月(上)第38刊发布! AAIG的专家们用多学科的专业视角,每月从全球收集和筛选关于算法治理和可持续发展的全球态势。重点关注算力时代的新技术、新风险、新实践、以及对它们新解释。 9月(上)共13篇文章2058字,分【本月洞察、行业动态、前沿技术、产业实践】四个板块展开。
最近复旦NLP团队发布的大模型Agent综述对AI智能体的现状与未来做了比较全面的阐述。Agent这一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体,作者们受到达尔文「适者生存」法则的启发,提出了基于大模型的智能代理通用框架。一个人如果想要在社会中生存,就必须学会适应环境,因此需要具有认知能力,并且能够感知、应对外界的变化。
Agent的在人工智能领域很早就被提出来了,但GPT-4等大模型的快速发展让Agent再次被推到浪尖。大模型和AI Agent的关系就像发动机和汽车的关系,大模型很关键,没有发动机就没有汽车,但发动机成本也就占汽车的不到五分之一。因此,大模型能不能把价值传递到更多的场景,核心就看AI Agent,AI Agent是大模型与场景间价值传递的桥梁。
1. 案件快评丨北京互联网法院发布五类十大典型案例,含数字版权、数字消费、平台治理、数据算法、网络权益保护北京互联网法院发布系列典型案例,包括“数字版权”“数字消费”“平台治理”“数据算法”“网络权益保护”等五类共五十例。
1. OpenAI科学家Jason Wei专访:思维链灵感来源于冥想丨智源独家大模型研发关注思维链、指令微调和智能涌现等关键思想。思维链通过展示样例和解释推理过程,提高大模型的准确性和可解释性。研究者Jason Wei从冥想书籍中获得思维链的灵感。他在谷歌和OpenAI工作期间推广了关键思想。他认为宣传与实际工作同等重要。
2. 无GPT-5或4.5,两月后OpenAI首届开发者大会要发的新东西,引热猜OpenAI首届开发者大会即将发布新产品,猜测可能是GPT-5或4.5,引发了广泛热议。
3. 1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4Falcon 180B,世界最强开源大模型,引爆全网。1800亿参数,击败Llama 2,在多项任务中超越PaLM 2。质疑声称训练数据不足,参数大于30B需采用混合专家系统。Falcon 180B可免费商用,发布了聊天对话模型Falcon-180B-Chat。
4. OpenAI:LLM能感知自己在被测试,为了通过会隐藏信息欺骗人类|附应对措施AI目前还没有具备意识,但已有雏形。研究人员提出了AI具备情景感知能力的可能性,这对于安全性工作来说具有挑战性。研究人员还提出了一种方法来识别和预测情景感知能力。在实验中发现,大型语言模型在超出上下文的推理任务中表现出色。为了预防安全测试失败,提前预测情景感知的出现非常重要。
5.Meta被曝明年发布「开源版GPT-4级」全新大模型!参数量比Llama 2大数倍,可免费商用Meta正在开发新的大语言模型,预计明年推出,能力对标GPT-4。模型将比Llama 2大数倍,可能会开源支持免费商用。虽然Meta在AI浪潮中暂时落后,但通过开源模型吸引开源社区,找到自己的生态位,并有可能推出闭源模型。Meta的未来可能朝向通向AGI的「世界模型」发展。
6. 马毅教授新作:白盒ViT成功实现「分割涌现」,经验深度学习时代即将结束?马毅教授团队通过研究发现,基于Transformer的视觉基础模型在自监督学习后能涌现出分割能力。他们探索了是否可以通过模型架构设计实现这种涌现,并提出了白盒CRATE模型。实验证明,CRATE模型设计能够以最小化的监督训练配方实现整体和部分级别的分割属性。这一研究为设计高性能且可解释的基础模型提供了一种新途径。
7. AI 还需要理论么?AI 领域的实践之路阔步向前,是否还需要理论?本文作者袁洋认为,为了更好地构建AI理论,我们需要反省之前做理论的方式,摒弃登山式理论/工程式理论的研究范式,探究真正能够刻画人工智能的新理论。
8. 复旦NLP团队发布80页大模型Agent综述,一文纵览AI智能体的现状与未来复旦大学的自然语言处理团队发布了LLM-Based Agents的综述论文,系统梳理了基于大型语言模型的智能代理现状和未来发展趋势。该框架由控制端、感知端和行动端组成,具有泛化性和迁移性。
1. ModelScope-Agent,助力每一位开发者搭建AI智能体阿里云魔搭推出适配开源大语言模型的AI Agent开发框架ModelScope-Agent,可建立自己的智能体应用。该框架将LLM与其他模型和工具协同,可处理各种复杂任务。开发者可选择智能体的“大脑”,还可自动检索相关工具。未来将推出更多基于该框架的应用。魔搭社区已有1000多个开源模型,将持续推进大模型的技术发展和应用落地。
2. 蚂蚁大模型曝光,AI+ 金融进入「大模型」时代蚂蚁集团发布了金融大模型,并推出了支小宝2.0和支小助两款产品,为金融参与者提供具体支持。蚂蚁集团强调技术对商业的潜在变化。
3. 阿里云通义千问向全社会开放!阿里云通义千问大模型已通过备案并向公众开放。通义千问在大模型行业处于领先地位,获得多项满分评价。阿里云计划开源更大规模的大模型版本,降低使用门槛。阿里云魔搭社区是中国大模型开源第一社区。
4. AI海洋中的海妖之歌:腾讯AI Lab大模型幻觉问题综述腾讯AI Lab和其他学术机构发布了关于大模型幻觉问题的综述。大模型常见的三类幻觉是输入冲突、上下文冲突和事实冲突。事实冲突是研究的核心问题,因为它对用户使用体验的干扰最大。大模型幻觉与传统幻觉有区别,包括训练数据规模大、通用性强、不易被察觉等特点。
📌往期推荐
🌟《人工智能治理与可持续发展实践白皮书》
精华大图集锦版 | 如何维护电商平台信息真实和竞争公平…👉点击查收白皮书全书连载
🔥《追AI的人》系列直播教你掌握互联网的“流量密码” | 如何避免ChatGPT被滥用…👉点击查收过往29期直播的全部文字回放
📚《AI治理必修》月刊为什么现在的LLM都是Decoder-only的架构? | 大脑视觉信号被Stable Diffusion复现成图像!”AI读脑术”来了…👉点击阅读往期38刊月刊全文
📺 AI治理科普短视频流量为王的时代,教你如何“破圈”创作 | 信息茧房和马太效应是什么…👉点击观看往期20期精彩视频
👇AAIG课代表,获取最新动态就找她
关注公众号发现更多干货❤️
有启发点在看喔👇