SuperCLUE发布中文大模型总分位列总排行榜第四
SuperCLUE 10月榜单发布 vivo自研大模型位列国内第一……
SuperCLUE是业界最权威的中国通用大型车型多层次综合评价基准。 在本次评测中,SuperCLUE选取了国内外20个最具代表性的通用大语言模型,并设置了新的3754个测试题。 综合考察大型模型在汉语能力方面的表现,最终评选出包括总排名在内的前五名榜单。
从榜单中可以看出,国内大机型产品竞争依然激烈,vivo自研大机型在三项榜单(总体排名、多轮开放问题OPEN排名、十强基础能力榜单)中领跑,文心一言4.0和SenseChat 3.0在OPT三大能力客观题排名中均跻身前三。 各大车型都在特定领域表现出了相对的竞争优势。
据此前消息,2023年vivo开发者大会将于11月1日正式开幕。大会期间,vivo将发布5个自主研发的大模型矩阵,包括十亿、百亿、千亿三个不同参数级别。