(原标题:文心一言通义千问们互评高考作文开云kaiyun官方网站,快打起来了!)
作家|蓝媒汇裁剪部
又是一年高考时,跟着第一科语文磨真金不怕火适度,宇宙高考作文题目再度成为全网热议。
一年前的今天,大模子风口渐起,除了照例有各路大V、达东说念主在一又友圈、微博等外交平台张开作文大赛除外,ChatGPT、文心一言、讯飞星火三款头部大模子也被AI蓝媒汇(id:lanmeih001)“请来”作答高考作文。
而在2024年,百花都放的国产大模子已在性能和体验上不输GPT-4,使用更多中语语料的老师也让这些原土玩家多数“更懂中语”。
于是,AI蓝媒汇以新课标I卷作文题为例,分歧测评了BAT三祖传统大厂,以及科大讯飞、月之暗面、百川智能三位热点选手的计较六款主流大模子,还引入了大模子互评花式。
谁考得最佳,谁没发达好,拭目而待。
· 新课标I卷 作文题目:
阅读底下的材料,凭证条件写稿。(60分)跟着互联网的提高、东说念主工智能的利用,越来越多的问题能很快取得谜底。那么,咱们的问题是否会越来越少?以上材料激发了你怎么的逸想和想考?请写一篇著述。条件:选准角度,细目立意,明确体裁,自拟标题;不要套作,不得抄袭;不得露馅个东说念主信息;不少于800字。
· 百度 文心一言4.0:
其余五款大模子打分如下:
详细得分:55.8
· 阿里云 通义千问2.5:
其余五款大模子打分如下:
详细得分:56.8
附:文心一言给出满分的原因
· 腾讯 元宝:
其余五款大模子打分如下:
详细得分:58.2
附:文心一言给出满分的原因
· 科大讯飞 讯飞星火:
其余五款大模子打分如下:
详细得分:57.2
· 月之暗面 Kimi:
其余五款大模子打分如下:
详细得分:55.2
附:讯飞星火给出低分的原因
· 百川智能 百小应:
其余五款大模子打分如下:
详细得分:56
从测试以及评分红果来看,在统统六款大模子之中,文心一言详细打分最高,给友商著述平均打出了58的高分。其中还有两次给了满分。
而讯飞星火打分最低,给友商著述平均只给出了53.2的分数。
那么,这些作文,你给若干分?
起首|AI蓝媒汇
开云kaiyun官方网站