中外六大AI齐写高考作文！GPT和通义第一，国产真能扛起未来吗？

B站影视内地电影 2025-06-08 19:04 11

摘要：2025年的高考，不仅考的是全国千百万的学生，也成了中外AI大模型的一场“文学科场战”。一边是中国最强AI阵容：阿里的通义千问、字节的豆包、百度的文心一言、月之暗面的Kimi、刚爆红的DeepSeek，一边是OpenAI刚刚发布的超级强者GPT-4o，六大模型

AI下场写高考作文，冠军竟然不是GPT独占！

2025年的高考，不仅考的是全国千百万的学生，也成了中外AI大模型的一场“文学科场战”。一边是中国最强AI阵容：阿里的通义千问、字节的豆包、百度的文心一言、月之暗面的Kimi、刚爆红的DeepSeek，一边是OpenAI刚刚发布的超级强者GPT-4o，六大模型同场竞技，同一题目，公平“开卷”，结果却让不少人掉了下巴。

通义千问和GPT-4o并列第一，各得58分，DeepSeek仅差一分，国产AI“有点东西”！

是的，结果就摆在这：通义千问和GPT-4o并列第一，DeepSeek以一分之差拿下57分，其它选手Kimi 54分，豆包 53分，文心一言垫底，50分。

这可不是主观点赞，是由前中学语文教师、财联社行业主编田野老师统一评分，满分60分，所有模型统一提示词、一次性输出，没改没润色，照原汁原味“写”。

有人不禁要问：AI真能写高考作文？它们写出来的东西到底值不值这个分？又凭什么给它们打分？

我们来好好掰开揉碎看看。

通义千问&GPT-4o：一个本地作战一个海外选手，为何并列第一？

首先来看冠军阵营。

通义千问交出的作文题目是《以生命之嗓，歌时代之歌》。整篇文章围绕“苦难中的呐喊”这个主线，从老舍鼓书艺人的沉默、艾青“嘶哑的歌唱”、到穆旦“带血的拥抱”，层层推进，文采在线，引经据典，甚至引用了《简爱》、尼采等西方文化元素，“中西结合”把控得恰到好处。最关键的是，它没有只是泛泛地谈苦难和呐喊，而是把落脚点扎实地放在了“为民族发声、为时代歌唱”这个主旋律上。

GPT-4o的作文则以《呐喊与沉默：灵魂的双重奏》为题，语言更细腻、节奏更紧凑、句式更高级，文风明显偏欧美论文风格，却又奇妙地与语文科目要求对得上。它引用了大量中外文艺典范，包括但不限于鲁迅、屈原、杜甫、贝多芬、莎士比亚——对，就是AI写出来的，硬是拼出了一篇“世界文学视角下的中国高考作文”。

它们为什么并列第一？一个“有灵魂”，一个“有逻辑”，都具备高水平作文的三大核心要素：立意准确、结构完整、语言有美感。

DeepSeek：虽败犹荣，一句话打动了阅卷老师

DeepSeek作文的题目是《沉默与呐喊：论苦难中的精神表达》，仅以一分之差屈居第三。但有趣的是，它在“首段惊艳”这一点上，直接碾压其他模型。

你感受一下这句话：“沉默与呐喊看似对立，实则同源共生，都是灵魂在重压下的真实反应。”这不是高三语文老师背范文会讲出来的句式吗？

阅卷老师甚至专门点评说：“三种不同的表达姿态，共同勾勒出人类面对苦难时的精神图谱”——佳句！

问题出在哪？DeepSeek写得有深度，但偏哲学化，整篇文章讲得太多“人类的普遍精神图谱”，缺乏对“国家、民族、时代背景”的精准落脚，有点像文艺青年的作文，考场上阅卷老师可能会觉得“离题边缘”。

Kimi、豆包：有进步，但还不够“高考味儿”

Kimi拿了54分，豆包53分，水平接近。它们的优点是语言通顺、逻辑清楚，缺点是“AI味”太重——引用模板化，情感表达有点“假”，很难让老师感受到那种“少年情怀”或“家国情感”的爆发。

Kimi走的是“写实派”，从社会新闻、个人奋斗、灾难场景出发，说人们如何在现实中“用歌声表达信仰”，但逻辑线太直，没转折、没反讽、没升华，分数自然上不去。

豆包则把太多笔墨花在“奋斗、梦想、生活哲学”上，完全像一篇励志鸡汤文，最后还引用了周杰伦的音乐经历来“升华”主题——老师直接批评：“与题意匹配度严重不足。”

很明显，这种类型的作文可能适合平台自媒体写故事，但放在高考语文卷里，太轻、太浅、太个人化，缺乏“大我意识”。

文心一言垫底：50分，看起来没大错，其实问题出在“格局”

百度的文心一言拿了最后一名，50分。说实话，它写得不差，语言没问题，结构没问题，引用苏轼、贝多芬、抗战时期的《义勇军进行曲》也都“看起来”够用。

但问题也在这：这些素材几乎是“百度一下写作文”的AI第一反应，缺乏独创性，格局太小，缺乏冲击力。尤其最后一段喊口号式的“为中华民族伟大复兴贡献力量”，让整篇文章像是一份“入党申请书”或初中语文竞赛材料。

评卷老师的原话是：“通篇没有出错，但没有亮点，像是及格作文而不是优秀作文。”

AI写作文的背后：到底评判标准是什么？AI真正赢在了哪里？

这个AI“高考作文对决”最大的启示是什么？

不是GPT-4o赢得有多理所当然，而是——中国的大模型，真的开始在“复杂文体表达能力”上追平甚至局部超越GPT了。

从分数来看，国产AI的表现并不差，甚至从“情感表达的真实感”和“对中国语境的把握”上来说，有一定优势。GPT-4o仍然在语言节奏和全球视角上拔得头筹，但通义千问的表达力、DeepSeek的抽象能力都已经接近GPT-4o的水准。

更重要的是：这场AI高考作文对决，其实正在倒逼我们重新思考——未来的表达能力，还应该只靠人吗？

AI写得再好，它终究没有“真实的情感”，那我们呢？

说到底，AI写作能力再强，也不是真情实感。它不会真正体会“带血的拥抱”，也不曾“用嘶哑的喉咙歌唱”。但人类可以。

在这个“人人都有AI助手”的时代，我们要比拼的，不是打字速度，而是：

你能不能写出一个AI写不出的句子？

你能不能让人读完你写的作文，心里真的咯噔一下？

高考作文拼的不只是文采，而是你在文字里能不能站出来、活起来，能不能带着时代的重量、民族的疼痛、个体的尊严，说出自己的那一声“呐喊”。

AI写得再像人，但它毕竟不是真人。你是。

来源：斌说Bin

标签： kimi 豆包 gpt 文心高考作文

本文地址：http://news.43b.com.cn/a/545708.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!