摘要:2025年的高考,不仅考的是全国千百万的学生,也成了中外AI大模型的一场“文学科场战”。一边是中国最强AI阵容:阿里的通义千问、字节的豆包、百度的文心一言、月之暗面的Kimi、刚爆红的DeepSeek,一边是OpenAI刚刚发布的超级强者GPT-4o,六大模型
AI下场写高考作文,冠军竟然不是GPT独占!
2025年的高考,不仅考的是全国千百万的学生,也成了中外AI大模型的一场“文学科场战”。一边是中国最强AI阵容:阿里的通义千问、字节的豆包、百度的文心一言、月之暗面的Kimi、刚爆红的DeepSeek,一边是OpenAI刚刚发布的超级强者GPT-4o,六大模型同场竞技,同一题目,公平“开卷”,结果却让不少人掉了下巴。
通义千问和GPT-4o并列第一,各得58分,DeepSeek仅差一分,国产AI“有点东西”!
是的,结果就摆在这:通义千问和GPT-4o并列第一,DeepSeek以一分之差拿下57分,其它选手Kimi 54分,豆包 53分,文心一言垫底,50分。
这可不是主观点赞,是由前中学语文教师、财联社行业主编田野老师统一评分,满分60分,所有模型统一提示词、一次性输出,没改没润色,照原汁原味“写”。
有人不禁要问:AI真能写高考作文?它们写出来的东西到底值不值这个分?又凭什么给它们打分?
我们来好好掰开揉碎看看。
通义千问&GPT-4o:一个本地作战一个海外选手,为何并列第一?
首先来看冠军阵营。
通义千问交出的作文题目是《以生命之嗓,歌时代之歌》。整篇文章围绕“苦难中的呐喊”这个主线,从老舍鼓书艺人的沉默、艾青“嘶哑的歌唱”、到穆旦“带血的拥抱”,层层推进,文采在线,引经据典,甚至引用了《简爱》、尼采等西方文化元素,“中西结合”把控得恰到好处。最关键的是,它没有只是泛泛地谈苦难和呐喊,而是把落脚点扎实地放在了“为民族发声、为时代歌唱”这个主旋律上。
GPT-4o的作文则以《呐喊与沉默:灵魂的双重奏》为题,语言更细腻、节奏更紧凑、句式更高级,文风明显偏欧美论文风格,却又奇妙地与语文科目要求对得上。它引用了大量中外文艺典范,包括但不限于鲁迅、屈原、杜甫、贝多芬、莎士比亚——对,就是AI写出来的,硬是拼出了一篇“世界文学视角下的中国高考作文”。
它们为什么并列第一?一个“有灵魂”,一个“有逻辑”,都具备高水平作文的三大核心要素:立意准确、结构完整、语言有美感。
DeepSeek:虽败犹荣,一句话打动了阅卷老师
DeepSeek作文的题目是《沉默与呐喊:论苦难中的精神表达》,仅以一分之差屈居第三。但有趣的是,它在“首段惊艳”这一点上,直接碾压其他模型。
你感受一下这句话:“沉默与呐喊看似对立,实则同源共生,都是灵魂在重压下的真实反应。”这不是高三语文老师背范文会讲出来的句式吗?
阅卷老师甚至专门点评说:“三种不同的表达姿态,共同勾勒出人类面对苦难时的精神图谱”——佳句!
问题出在哪?DeepSeek写得有深度,但偏哲学化,整篇文章讲得太多“人类的普遍精神图谱”,缺乏对“国家、民族、时代背景”的精准落脚,有点像文艺青年的作文,考场上阅卷老师可能会觉得“离题边缘”。
Kimi、豆包:有进步,但还不够“高考味儿”
Kimi拿了54分,豆包53分,水平接近。它们的优点是语言通顺、逻辑清楚,缺点是“AI味”太重——引用模板化,情感表达有点“假”,很难让老师感受到那种“少年情怀”或“家国情感”的爆发。
Kimi走的是“写实派”,从社会新闻、个人奋斗、灾难场景出发,说人们如何在现实中“用歌声表达信仰”,但逻辑线太直,没转折、没反讽、没升华,分数自然上不去。
豆包则把太多笔墨花在“奋斗、梦想、生活哲学”上,完全像一篇励志鸡汤文,最后还引用了周杰伦的音乐经历来“升华”主题——老师直接批评:“与题意匹配度严重不足。”
很明显,这种类型的作文可能适合平台自媒体写故事,但放在高考语文卷里,太轻、太浅、太个人化,缺乏“大我意识”。
文心一言垫底:50分,看起来没大错,其实问题出在“格局”
百度的文心一言拿了最后一名,50分。说实话,它写得不差,语言没问题,结构没问题,引用苏轼、贝多芬、抗战时期的《义勇军进行曲》也都“看起来”够用。
但问题也在这:这些素材几乎是“百度一下写作文”的AI第一反应,缺乏独创性,格局太小,缺乏冲击力。尤其最后一段喊口号式的“为中华民族伟大复兴贡献力量”,让整篇文章像是一份“入党申请书”或初中语文竞赛材料。
评卷老师的原话是:“通篇没有出错,但没有亮点,像是及格作文而不是优秀作文。”
AI写作文的背后:到底评判标准是什么?AI真正赢在了哪里?
这个AI“高考作文对决”最大的启示是什么?
不是GPT-4o赢得有多理所当然,而是——中国的大模型,真的开始在“复杂文体表达能力”上追平甚至局部超越GPT了。
从分数来看,国产AI的表现并不差,甚至从“情感表达的真实感”和“对中国语境的把握”上来说,有一定优势。GPT-4o仍然在语言节奏和全球视角上拔得头筹,但通义千问的表达力、DeepSeek的抽象能力都已经接近GPT-4o的水准。
更重要的是:这场AI高考作文对决,其实正在倒逼我们重新思考——未来的表达能力,还应该只靠人吗?
AI写得再好,它终究没有“真实的情感”,那我们呢?
说到底,AI写作能力再强,也不是真情实感。它不会真正体会“带血的拥抱”,也不曾“用嘶哑的喉咙歌唱”。但人类可以。
在这个“人人都有AI助手”的时代,我们要比拼的,不是打字速度,而是:
你能不能写出一个AI写不出的句子?
你能不能让人读完你写的作文,心里真的咯噔一下?
高考作文拼的不只是文采,而是你在文字里能不能站出来、活起来,能不能带着时代的重量、民族的疼痛、个体的尊严,说出自己的那一声“呐喊”。
AI写得再像人,但它毕竟不是真人。你是。
来源:斌说Bin