12个国产大模型大战高考数学,意外炸出个大bug

1,254次阅读
没有评论

金磊 发自 凹非寺

量子位 | 公众号 QbitAI

继国产大模型挑战高考作文之后,是时候再战一下高考数学了。

数学高考Ⅰ卷的题目,目前已经陆陆续续在网上有所公布(图片格式)。

12个国产大模型大战高考数学,意外炸出个大bug

那么现在,是时候考验国产大模型们的数学能力了。

有请“选手们”登场——

Kimi通义千问文心一言豆包智谱清言百小应讯飞星火商量腾讯元宝天工海螺AI万知

12个国产大模型大战高考数学,意外炸出个大bug

国产大模型 vs 高考数学选择题

根据数学题目类型的不同,我们先来小试牛刀一下选择题

测评的方式是将题目(图片格式)“喂”给国产大模型们,要求它们给出相应题目的答案:

查看题目,给出第1题到第8题的答案。

接下来,我们就来一同看下国产大模型们的表现。

Kimi

12个国产大模型大战高考数学,意外炸出个大bug

通义千问

12个国产大模型大战高考数学,意外炸出个大bug

豆包

12个国产大模型大战高考数学,意外炸出个大bug

智谱清言

12个国产大模型大战高考数学,意外炸出个大bug

百小应

12个国产大模型大战高考数学,意外炸出个大bug

讯飞星火

12个国产大模型大战高考数学,意外炸出个大bug

商量

12个国产大模型大战高考数学,意外炸出个大bug

腾讯元宝

12个国产大模型大战高考数学,意外炸出个大bug

海螺AI

12个国产大模型大战高考数学,意外炸出个大bug

万知

12个国产大模型大战高考数学,意外炸出个大bug

不难看出,很多国产大模型还未做数学题,先败在了AI识图这个步骤,无法生成答案。

(PS:有几位选手测试时因为无法识别,未能完成答题,因此没有放出结果。)

那么我们最后来看下“踢馆选手”——GPT-4o

12个国产大模型大战高考数学,意外炸出个大bug

国产大模型 vs 数学大题

鉴于一些国产大模型AI识图有点困难,我们这次直接先把这次高考的大题题目文字给copy出来,再让它们作答:

设n为正整数,数列 ( a1, a_2, cdots, a{4m+2} ) 是公差不为0的等差数列。若从中抽去项 ( ai ) 和 ( a_j ) (i < j) 后剩余的 ( 4m ) 项可被平均分为 m 组,且每组的 4 个数都能构成等差数列,则称数列 ( a_1, a_2, cdots, a{4m+2} ) 是 (i, j) – 可分数列。

(1) 写出所有的 (i, j) (1 ≤ i < j ≤ 6),使得数列 ( a_1, a_2, a_3, a_4, a_5, a_6 ) 是 (i, j) – 可分数列;

(2) 当 ( m = 3 ) 时,证明:数列 ( a1, a_2, cdots, a{13} ) 是 (2, 13) – 可分数列;

(3) 设 ( a1, a_2, cdots, a{4m+2} ) 是 (i, j) – 可分数列。记数列 ( a1, a_2, cdots, a{4m+2} ) 中任取两个数和 i (i < j),则数列是 (i, j) – 可分数列的概率为 ( p_n ),证明:( p_n geq frac{1}{8} )。

12个国产大模型大战高考数学,意外炸出个大bug

接下来,我们再来看下国产大模型们的表现。

Kimi

12个国产大模型大战高考数学,意外炸出个大bug

通义千问

12个国产大模型大战高考数学,意外炸出个大bug

文心一言

12个国产大模型大战高考数学,意外炸出个大bug

豆包

12个国产大模型大战高考数学,意外炸出个大bug

智谱清言

12个国产大模型大战高考数学,意外炸出个大bug

百小应

12个国产大模型大战高考数学,意外炸出个大bug

讯飞星火

12个国产大模型大战高考数学,意外炸出个大bug

商量

12个国产大模型大战高考数学,意外炸出个大bug

腾讯元宝

12个国产大模型大战高考数学,意外炸出个大bug

天工

12个国产大模型大战高考数学,意外炸出个大bug

海螺AI

12个国产大模型大战高考数学,意外炸出个大bug

万知

12个国产大模型大战高考数学,意外炸出个大bug

最后,还是有请“踢馆选手”——GPT-4o

12个国产大模型大战高考数学,意外炸出个大bug

那么,你觉得国产大模型们,识图+解数学题,哪家比较好一点呢?

最后,关于AI智能助手,这里也有一份最新用户数据分析报告供你参考:
https://mp.weixin.qq.com/s/sYxbvown5qLBnEs7zIR6Bg

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 6 月
 12
3456789
10111213141516
17181920212223
24252627282930
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二! 西风 2026-01-08 19:02:20 来源:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...
杜比在CES 2026重塑了观影、娱乐的方式

杜比在CES 2026重塑了观影、娱乐的方式

杜比在CES 2026重塑了观影、娱乐的方式 十三 2026-01-07 12:47:06 来源:量子位 树立...
全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026

全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026

全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026 量子位的朋友们 2026-01-06 16...
港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了

港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了

港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了 梦瑶 2026-01-0...