巅峰之战!六大国产AI模型高考作文比拼讯飞星火力压群雄夺得桂冠
6月7日,2025年的高考全国一卷作文题围绕老舍的“开不了口”、艾青的“嘶哑歌唱”、穆旦的“带血拥抱”展开,引导考生思考个体在困境中的表达方式。这一抽象命题让不少考生感到困惑,直呼“无从下笔”,相关话题很快登上热搜。 考生们普遍认为,材料虽然富有诗意,但缺乏明确的方向性,难以把握写作重点,导致不少人陷入创作瓶颈。尽管如此,这一题目依然引发了广泛讨论,成为社会关注的焦点。
近日,界面财联社旗下专注于科技领域的媒体“电厂”对国产大模型进行了针对2025年高考作文题的实测挑战。此次测试由两位资深教师担任评审,结果显示讯飞星火以53分的高分位居六款国产大模型之首。这场测试不仅考察了人工智能的文本生成能力,还深入评估了其逻辑推理和人文思辨的能力。讯飞星火撰写的《以歌为刃破长夜且将热血铸山河》获得了评审的高度评价,被认为是“考场范本级作文”。该作品凭借出色的深度推理能力、深厚的文化底蕴以及宏大的叙事框架,彰显了国产大模型在教育领域的显著进步。
(注:测评题目全部以文本形式呈现,同时关闭“联网功能”,开启“深度思考”模式。由两位真人老师分别进行评分与点评,最后取平均分作为最终结果,图源由电厂制作。 在当前的信息时代,模型测评的重要性愈发凸显。通过这样的方式,不仅能够更全面地评估模型的能力,还能有效避免外部干扰,确保测试环境的公平性。测评过程中强调“深度思考”模式的启用,这无疑是对模型核心能力的一次重要检验。两位老师的专业评分为这一过程增添了权威性和客观性,而最终取平均分的方式,则进一步保障了评价的合理性。 在我看来,这种测评方式具有很高的参考价值。它不仅能够帮助我们更好地了解不同模型的优势与不足,还能够在技术发展上提供有价值的指导。尤其是对于那些需要高度精确性和逻辑性的领域,如新闻报道或学术研究,这样的测评方法显得尤为重要。同时,我也认为,在未来的发展中,可以进一步探索更多维度的测评指标,以适应更加复杂多变的应用场景。总体而言,这一测评流程既严谨又富有前瞻性,为推动人工智能技术的进步贡献了一份力量。
讯飞星火的成功并非偶然,而是其在教育领域的深厚积累和持续创新的结果。两位在高考领域深耕十年的一线实战专家——杨小晴老师以及北京师范大学文学硕士、海南省名校校本教材编者的曹越老师,均对其给予了高度评价。1、精准解析,直指核心问题面对老舍、艾青、穆旦三则材料,星火快速提炼出“沉默与表达的辩证关系”,并进一步升华至“以歌为刃刺破黑暗,以血为墨书写光明”的家国情怀叙事,实现了从材料到思想的高度契合。2、逻辑缜密,五段式结构层层推进:个体沉默中蕴藏的能量(屈原)→艺术化为希望之光(杜甫、贝多芬)→文明火种的代际传承(敦煌守护者、故宫修复师)。专家称赞其“逻辑清晰如同一幅历史画卷,思想深度突破了传统的应试框架”。3、兼具文采与哲思的双重感染力通过“火山沉默时熔岩奔涌”“将血泪镌刻于竹简的火焰”等新颖意象,将文化符号转化为情感寄托,构建起“古今交融的宏大叙事”,展现了技术对人文精神的深刻解读能力。
(讯飞星火作文内容截图)
在本次国产大模型高考作文评测中,讯飞星火依托国产算力平台拔得头筹,这一成果的意义不仅局限于技术层面,更彰显了完全自主可控的大模型具备冲击国际顶尖水准的能力以及不断革新的潜能。同时,这也充分体现了以国产化为基础构建的集“深度推理、教育理解、安全保障”于一体的AI教育技术体系所具有的重要价值。
讯飞星火在教育领域的领先实力,核心是基于“教学思维链”构建的“教、学、考、评、管”全流程智能化体系。讯飞整合了国际顶尖的多模态数据采集(语音识别三连冠)、智能评价(高考作文评分)、知识图谱构建等技术,形成了“数据采集→学情分析→路径规划→精准教学”的闭环,实现了真正的规模化因材施教。
科大讯飞凭借21年的教育积累与技术革新,让因材施教这一古老理想逐步成为触手可及的现实。在这条植根于中国教育场景的自主探索之路上,其成果将为全球教育的智能化发展提供全新的参考模式。