SuperCLUE中文通用大模型基准6月测评发布:360智脑蝉联“国产第一”
创意风暴
2024-05-19 15:34:29
0

6月19日,中文通用大模型基准(SuperCLUE)最新发布“6月榜单”,三六零集团(601360.SH,以下简称360)自研认知型通用大模型“360智脑”多项能力蝉联国产大模型第一,部分能力评分已超越GPT-3.5甚至超越GPT-4。

SuperCLUE是针对中文可用的通用大模型测评基准,代表时下中文大模型的发展效果情况。SuperCLUE从基础能力、中文特性、学术与专业能力三个层面对国内外通用大模型产品进行测试,“360智脑”在以上三方面均位列国内第一,世界第三。

上月出炉的SuperCLUE榜单中,360智脑已取得“国产大模型第一”的成绩。为避免“刷题”,确保结果公正客观,SuperCLUE在6月新一轮测评中采用了全新独立的评测数据集,同时数量级扩大近10倍到3714道题。测试结果显示,360智脑与GPT-3.5的总分差距从上月的8分缩小至本月的5分以内,同时在上下文对话、语义理解、计算等能力上,评分已追平甚至超越GPT。

据了解,过去3个月内,360智脑已完成从1.0版本到4.0版本的迭代,刷新了国产大模型的“中国速度”。“360智脑4.0”已具备跨模态生成能力,并依托该能力全国首发大模型定制“AI数字人”和“文生视频”功能。

相关内容

SuperCLUE中文通用...
6月19日,中文通用大模型基准(SuperCLUE)最新发布“6月...
2024-05-19 15:34:29
东风风行星海S7申报图 基...
易车讯 日前,我们从工信部网站获得了一组东风风行星海S7申报图。新...
2024-05-16 09:22:01

热门资讯

路特斯EMEYA首发,高性能四... 继首款高性能电动SUV——ELETRE之后,近日路特斯汽车再次对外发布了品牌第二款性能车——EMEY...
【研报掘金】机构:铜供需格局向... 机构指出,铜价具有坚实支撑,即将开启长周期上行的大趋势。展望2024年,铜的供需格局好于2023年,...
11公里科技长滩!广州海丝城最... 广州海丝城,蝶变在即。 1月26日下午,广州开发区、黄埔区召开广州海丝城规划设计中期成果专家评审会...
伊朗宣布对28个国家单方面免签   据伊朗官方通讯社消息,当地时间1月31日,伊朗外交部副领事贝克达利表示,伊朗宣布对沙特、阿联酋、...
风水轮流转 3年来投资者从未这... 智通财经APP注意到,过去两个月,小盘股在华尔街风靡一时。根据美国银行对基金经理的最新调查,投资者近...
茶饮品牌开年激战:奈雪们放低加...   茶饮品牌们的竞争,在2024年开春后愈演愈烈。   2月28日,奈雪的茶(02150.HK)公布...
突发行情!黄金刚刚跌破2400... FX168财经报社(欧洲)讯 周五(7月12日),黄金价格下跌,但仍有望连续第三周上涨,因为美国通胀...
陇上文物里的“龙文化” 甘肃是中华文明重要的发祥地,其深厚无比的文化底蕴,在中华五千年历史长河中熠熠生辉。甘肃出土了许多有关...
手不沾面,10分钟就能出锅的早... 在这个快节奏的时代,早餐成了许多人忙碌生活中的一道难题。今天,我要给大家介绍一款既简单又美味的早餐蔬...
水利部:汛前深入排查整治水利相... 水利部负责人28日表示,各水利部门要以水库大坝、溢洪道、放空设施、堤防险工险段、穿堤建筑物等关键部位...