中国财经新闻网

您现在的位置是:首页 > 财经科技 > 正文

财经科技

智谱AI发布第三代基座大模型ChatGLM3及相关产品

财经网 2023-10-30财经科技
智谱AI推出第三代基座大模型ChatGLM3  性能全面突破……

ChatGLM3新技术升级,性能更高,成本更低

有了更丰富的训练数据和更好的训练方案,智普AI推出的ChatGLM3性能更加强大。 与ChatGLM2相比,MMLU提升36%,CEval提升33%,GSM8K提升179%,BBH提升126%。

同时,ChatGLM3瞄准GPT-4V,实现了多项新功能的迭代升级,其中包括具有多模态理解能力的CogVLM——图像识别语义,在10多个国际标准图形评价数据集上实现了SOTA; 代码增强模块Code Interpreter根据用户需求生成并执行代码,自动完成数据分析、文件处理等复杂任务; 网页搜索增强 WebGLM-访问搜索增强可以根据问题自动在互联网上搜索相关信息,并在回答时提供相关参考。 或文章链接。 ChatGLM3的语义和逻辑能力得到了极大的增强。

ChatGLM3还集成了自主研发的AgentTuning技术,激活了模型代理能力,特别是在智能规划和执行方面,相比ChatGLM2提升了1000%; 它还使国产大型模型能够原生支持工具调用、代码执行、游戏和数据库。 运算、知识图谱搜索与推理、操作系统等复杂场景。

此外,ChatGLM3此次推出了可部署在手机上的端测模型ChatGLM3-1.5B和ChatGLM3-3B。 支持vivo、小米、三星等多种手机及车载平台。 他们甚至支持移动平台上CPU芯片的推理。 速度高达 20 个令牌/秒。 在准确性方面,1.5B和3B模型的性能在公共基准上接近ChatGLM2-6B模型。

基于最新的高效动态推理和内存优化技术,ChatGLM3当前的推理框架在相同的硬件和模型条件下,比目前最好的开源实现更快,包括伯克利大学推出的vLLM和最新版本的ChatGLM3。拥抱脸TGI。 提升了2-3倍,推理成本也提升了一倍。 每千代币仅需0.5点,成本最低。

新一代“智普轻言”上线,国内首创代码交互能力

02

在全新升级的ChatGLM3的赋能下,生成式AI助手智浦轻言成为国内首款具备代码交互能力的大模型产品(代码解释器)。

“代码”功能目前支持图像处理、数学计算、数据分析等使用场景。 以下是:

03

04

05

处理数据、生成图表代码、绘制图形、上传SQL代码分析

06

在WebGLM大模型能力的加入下,智浦清研还具备搜索增强能力,可以帮助用户梳理相关问题的网络文献或文章链接,并直接提供答案。

此前发布的CogVLM模型提升了智浦青眼的中文图像和文本理解能力,实现了接近GPT-4V的图像理解能力。 它可以回答各类视觉问题,可以完成复杂的目标检测,并添加标签完成自动数据标注。

09

10

2022年初以来,智普AI推出的GLM系列模型已支持Ascend、神威超算、海光DCU架构上的大规模预训练和推理。 截至目前,智普AI产品已支持升腾、神威超算、海光DCU、海飞科、木兮兮云、计算科技、天枢智能芯、寒武纪、摩尔线程、百度昆仑芯、灵犀科技、长城等10余个国内硬件生态超云等通过与国内芯片企业联合创新,不断优化性能,有助于国产本土大机型和国产芯片尽快进入国际舞台。

11

智普AI推出的ChatGLM3及相关系列产品全面提升了模型性能,为行业打造了更加开放的开源生态,进一步降低了普通用户使用AIGC产品的门槛。 人工智能正在引领我们进入一个新时代,大型模型必将加速这一时刻的到来。