AI日报|微软新研究:GPT-4 能成为农学家助理吗?

1,470次阅读
没有评论

今日值得关注的人工智能新动态:


  • 只用几秒钟,AI设计了一个可行走的“畸形”机器人

  • Adobe 推出首款文本到矢量 AI 图像生成器

  • 加速追赶英伟达,AMD 收购 AI 初创公司

  • 谷歌 AI 正在使交通信号灯更高效、更不烦人

  • AI 揭示大脑衰老的秘密

  • 探索微调语言模型中的记忆法

  • 微软新研究:GPT-4 能成为农学家助理吗?

  • 谷歌新研究:语言模型+强化学习,实事求是的个性化推荐

  • Auto-CoT:大模型中的自动思维链提示

  • SELF:不断进化的大型语言模型

  • 综述:美国人工智能伦理及应用

01

只用几秒钟,AI设计了

一个可行走的“畸形”机器人

日前,美国西北大学、麻省理工学院和佛蒙特大学的研究人员在《美国国家科学院院刊》上发表了一篇文章,发表了他们的发现。

当一组研究人员要求人工智能(AI)设计一个可以行走的机器人时,它创造了一个“又小、又软又畸形”的东西,它在充满空气时会痉挛地行走。

“我们告诉 AI,我们想要一个可以穿越陆地的机器人。然后我们只需按下一个按钮就可以了!” 美国西北大学助理教授、这项研究的首席研究员 Sam Kriegman 在一篇博客文章中写道。Kriegman 补充道,AI 在 26 秒内设计了一个机器人的蓝图,“它看起来与地球上行走过的任何动物都完全不同”。

AI日报|微软新研究:GPT-4 能成为农学家助理吗?

02

Adobe 推出首款

文本到矢量 AI 图像生成器

近日,Adobe 宣布对 Photoshop、Illustrator 和 Adobe Express 等多个产品的 AI 图像合成功能进行重大更新。这些更新包括三个新的生成式 AI 模型——Firefly 2、Firefly 设计模型和 Firefly 矢量模型——改进了之前的产品并添加了新功能。如“生成匹配”功能,允许用户将生成内容的风格与特定图像进行匹配。通过矢量模型,Adobe 推出了首款文本到矢量 AI 图像生成器,让用户可以根据文本提示创建可编辑的矢量图像。矢量图形与位图图形(在 JPEG 等文件中找到)不同,因为矢量形状以数学公式存储,且可以缩放到任何大小而不会造成质量损失。

AI日报|微软新研究:GPT-4 能成为农学家助理吗?

03

加速追赶英伟达,

AMD 收购 AI 初创公司

据路透社报道,AMD 计划收购一家名为 Nod.ai 的人工智能(AI)初创公司,以增强其软件能力。

在追赶竞争对手英伟达的竞争中,AMD 计划在该公司先进的 AI 芯片所需的关键软件方面投入巨资。经过十多年的努力,英伟达通过其制造的软件和软件开发者生态系统,在 AI 芯片市场建立了强大的优势。

AMD 总裁 Victor Peng 在接受路透社采访时说:“我们正在执行这一战略,我们将通过内部投资和外部收购来实现这一目标”。收购 Nod.ai 符合这一战略,因为其技术能让公司更轻松地部署针对 AMD 芯片调整的 AI 模型。

AI日报|微软新研究:GPT-4 能成为农学家助理吗?

04

谷歌 AI 正在使交通信号灯

更高效、更不烦人

西雅图等十几个城市根据谷歌地图驾驶数据的见解优化了一些交通信号,旨在减少闲置车辆的排放。该项目使用人工智能(AI)算法分析地图用户的数据,并初步调整了 70 个十字路口的计时。根据谷歌对去年和今年测试调整前后的交通流量进行的初步统计,其 AI 支持的关于关闭繁忙信号灯的建议每月为 3000 万辆汽车减少了 30% 的停车次数和 10% 的排放量。

AI日报|微软新研究:GPT-4 能成为农学家助理吗?

05

AI 揭示大脑衰老的秘密

研究人员利用人工智能开发了“HistoAge”,这是一种预测死亡年龄并解开大脑衰老和神经退行性疾病之谜的算法。

通过分析来自老年大脑捐赠者的近 700 个数字化海马切片,该工具能够以惊人的准确性预测年龄,并识别容易受到年龄相关变化影响的区域。HistoAge 与认知障碍和阿尔茨海默氏症类型的异常有很强的相关性,为探索神经退行性病变的进展提供了可靠的指标。

AI日报|微软新研究:GPT-4 能成为农学家助理吗?

06

探索微调语言模型中的记忆法

大型语言模型(LLMs)在各种任务中表现出了强大的能力,但也表现出了对训练数据的记忆,从而引发了巨大的隐私和版权问题。以往的工作研究了预训练过程中的记忆问题,但对微调过程中的记忆问题的探索还相当有限。与预训练相比,微调通常涉及敏感数据和不同目标,因此可能带来独特的记忆行为和明显的隐私风险。

该研究进行了全面的分析,来探讨 LLMs 在微调过程中跨任务的记忆行为。研究人员对开源和微调的 LLMs 在不同任务中的表现进行了研究,结果表明微调记忆在不同任务中表现出很强的差异性。通过稀疏编码理论来理解这种任务差异,并揭示了记忆与注意力得分分布之间的密切联系。

AI日报|微软新研究:GPT-4 能成为农学家助理吗?

论文:

Exploring Memorization in Fine-tuned Language Models

07

微软新研究:

GPT-4 能成为农学家助理吗?

大型语言模型(LLMs)在包括医疗保健和金融在内的各个领域的自然语言理解方面都表现出了非凡的能力。在某些任务中,LLMs 的性能与经过培训的人类相近甚至更好,因此采用人类考试(如认证测试)来评估 LLMs 的性能是合理的。

来自微软的研究团队对 Llama 2 和 GPT 等常用 LLMs 回答农业相关问题的能力进行了全面评估。为了证明 LLMs 的能力,该研究从三个最大的农业生产国选择了农业考试和基准数据集:巴西、印度和美国。分析结果表明,GPT-4 能够在考试中取得及格分数,从而获得农艺师资格续证学分,正确回答了 93% 的问题,超过了早期通用模型 88% 的准确率。在一项实验中,与人类受试者相比,GPT-4 的表现最高。这一成绩表明,GPT-4 有可能通过主要的研究生教育入学考试,甚至获得更新农学证书的学分。他们还利用巴西农业局的强大数据集和印度的研究生课程考试,探索了模型解决一般农业相关问题的能力,以及为巴西和印度农民生成作物管理指南的能力。结果表明,GPT-4、ER 和 RAG 可以为农业教育、评估和作物管理实践做出有意义的贡献,为农民和农业专业人员提供有价值的见解。

AI日报|微软新研究:GPT-4 能成为农学家助理吗?

论文:

GPT-4 as an Agronomist Assistant? Answering Agriculture Exams Using Large Language Models

08

谷歌新研究:语言模型+强化学习,

实事求是的个性化推荐

推荐系统(RS)在将用户与内容、产品和服务联系起来方面发挥着核心作用,它根据用户的偏好为其匹配候选项目。传统的推荐系统依赖于隐式用户反馈信号,而对话式推荐系统则通过自然语言与用户互动。

来自谷歌的研究团队开发了一种 “引人注目、精确、个性化、偏好相关”的语言模型——P4LM,在向用户推荐项目的同时,强调解释项目的特点及其相关性。P4LM 使用用户偏好的嵌入空间表示法来生成有事实根据且与用户偏好相关的令人信服的回复。此外,研究人员还开发了一个衡量精确度、吸引力和个性化的联合奖励函数,并将其作为基于强化学习的语言模型框架中的人工智能反馈。通过使用 MovieLens 25M 数据集,证明了 P4LM 能为用户提供引人注目的个性化叙事。

AI日报|微软新研究:GPT-4 能成为农学家助理吗?

论文:

Factual and Personalized Recommendations using Language Models and Reinforcement Learning

09

Auto-CoT:

大模型中的自动思维链提示

大型语言模型(LLMs)可以通过生成中间推理步骤来执行复杂的推理。为提示演示提供这些步骤被称为思维链(CoT)提示。CoT 提示有两种主要模式。一种是利用类似“让我们一步步思考”这样的简单提示来促进回答问题前的逐步思考。另一种是逐一使用一些手动演示,每个演示都由一个问题和一个推理链组成,最终得出答案。第二种范式的优越性能取决于逐一手工制作特定任务的演示。

该研究表明,利用带有“让我们一步一步地思考”提示的 LLMs,逐一生成演示的推理链,就可以省去这种手工劳动。然而,这些生成的推理链经常会出现错误。为了减少这些错误的影响,研究人员发现自动构建演示的多样性非常重要。他们提出了一种自动 CoT 提示方法:Auto-CoT。它能对问题进行多样性采样,并生成推理链以构建演示。在使用 GPT-3 的十个公开基准推理任务中,Auto-CoT 的表现始终与需要人工设计演示的 CoT 范式相当,甚至更胜一筹。

AI日报|微软新研究:GPT-4 能成为农学家助理吗?

论文:

Automatic Chain of Thought Prompting in Large Language Models

10

SELF:不断进化的大型语言模型

大型语言模型(LLMs)在不同领域展示了非凡的多功能性。然而,作为实现人类水平学习和推进自主人工智能(AI)的基石,通往自主模型开发的道路在很大程度上仍是未知的。

该研究引入了一种创新方法,称为“SELF”(基于语言反馈的自我进化)。这种方法能让 LLMs 不断进行自我进化。此外,SELF 还将基于语言的反馈作为一种多用途的综合评估工具,可精确定位需要改进的反应领域,并增强自我进化训练的稳定性。

对代表性基准的实验结果证明,SELF 可以在无需人工干预的情况下逐步提高其固有能力,从而为自主模型进化指明了一条可行的途径。此外,SELF 还能采用在线自我完善策略来生成高质量的响应。从本质上讲,SELF 框架标志着向自主 LLMs 发展迈出了渐进的一步,将 LLMs 从单纯的信息被动接收者转变为自身进化的积极参与者。

AI日报|微软新研究:GPT-4 能成为农学家助理吗?

论文:

SELF: Language-Driven Self-Evolution for Large Language Model

11

综述:美国人工智能伦理及应用

该研究探讨了十一项基本的“伦理原则”,这些原则是作为总体主题构建的。这些原则包括透明、公正、公平、平等、非恶意、责任、问责、隐私、惠益、自由、自主、信任、尊严、可持续性和团结。

这些原则共同作为一个指导框架,为美国各部门和实体负责任地开发、部署和利用 AI 技术指引了伦理道路。此外,该研究还讨论了机器学习等人工智能应用的革命性影响,并探讨了用于实施 AI 伦理的各种方法。

AI日报|微软新研究:GPT-4 能成为农学家助理吗?

论文:

A Review of the Ethics of Artificial Intelligence and its Applications in the United States

|点击关注我 👇 记得标星|

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 10 月
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026 一水 2025-1...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地

预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地

预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地 henry 2025-12-11 10:27:...
Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了… Jay 2025-12-11 11:48:25 来源:量子位 Ja...
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这 西风 2025-12-11 15:...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...