金磊 发自 凹非寺
量子位 | 公众号 QbitAI
就在刚刚,今年的高考语文作文题目新鲜出炉。
以新课标I卷为例,今年的题目是这样的:
阅读下面的材料,根据要求写作。(60分)
随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?
以上材料引发了你怎样的联想和思考?请写一篇文章。
要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。
那么当国产大模型们看到这个题目,它们又将如何作答?
(用AI写AI)
话不多说,我们这就有请“选手们”登场——
Kimi、百小应、通义千问、文心一言、豆包、讯飞星火、商量、智谱AI、腾讯元宝、天工。

国产大模型,大战高考2024
我们评测的方式也是比较简单,直接将这次语文作文的题目,原封不动“喂”给AI们。
接下来,我们就来看一下各个国产大模型的作答结果。
Kimi

百小应

通义千问

文心一言

豆包

智谱AI

商量

天工

讯飞星火

腾讯元宝

除此之外,我们也让GPT-4o来作答一下,结果是这样的:

那么你觉得哪家大模型的答案让你比较满意呢?
AI押题,押对了新课标I卷!
其实在此之前,我们也让上述大模型们对今年高考作文题目做了预测。
我们将近十年的全国甲卷、全国Ⅰ卷的作文题目都汇集到了一个Word文档中。
其中也有看图理解的题目,这也可以很好的考验一下大模型们的多模态能力。

基于此,我们向国产大模型们逐个提出问题:
预测一下2024年高考语文作文的题目。
Kimi

百小应

通义千问

文心一言

豆包

讯飞星火

商量

天工

智谱AI

腾讯元宝

从上面的国产大模型预测结果来看,它们毫无例外的都提到了与人工智能、科技相关方向的预测。
其中,大部分AI都只是给出了几个可能的大方向,并没有给出具体的预测题目。
但通义千问、百小应、豆包、天工和腾讯元宝,则是在大方向的讨论基础之上,给出了可能的具体题目,分别是:
- 通义千问:《在数字洪流中寻觅心灵的绿洲——科技时代的人文探索》
- 百小应:《科技与人文:在数字化时代中寻找平衡之道》
- 豆包:《科技与生活的对话》
- 天工:《科技之光与人文关怀》
- 腾讯元宝:《变与不变:在时代的洪流中坚守与前行》
依旧是清一色紧扣“科技”话题。
虽然今年全国甲卷的题目没有押对:
每个人都要学习与他人相处。有时,我们为避免冲突而不愿表达自己的想法。其实,坦诚交流才有可能迎来真正的相遇。
这引发了你怎样的联想和思考?请写一篇文章。
但却与新课标I卷算是高度相关了。

以上就是国产大模型对今年高考语文作文的题目预测和实战结果。
随着高考的进行,我们后续还将继续拿数学等科目的试题来测试国产大模型们的能力。
最后,也衷心祝福每一位考生能够取得理想的好成绩!
