您现在的位置是：首页 > 财经科技 > 正文

财经科技

智谱AI发布第三代基座大模型ChatGLM3及相关产品

财经网 2023-10-30财经科技

智谱AI推出第三代基座大模型ChatGLM3 性能全面突破……

ChatGLM3新技术升级，性能更高，成本更低

有了更丰富的训练数据和更好的训练方案，智普AI推出的ChatGLM3性能更加强大。与ChatGLM2相比，MMLU提升36%，CEval提升33%，GSM8K提升179%，BBH提升126%。

同时，ChatGLM3瞄准GPT-4V，实现了多项新功能的迭代升级，其中包括具有多模态理解能力的CogVLM——图像识别语义，在10多个国际标准图形评价数据集上实现了SOTA；代码增强模块Code Interpreter根据用户需求生成并执行代码，自动完成数据分析、文件处理等复杂任务；网页搜索增强 WebGLM-访问搜索增强可以根据问题自动在互联网上搜索相关信息，并在回答时提供相关参考。或文章链接。 ChatGLM3的语义和逻辑能力得到了极大的增强。

ChatGLM3还集成了自主研发的AgentTuning技术，激活了模型代理能力，特别是在智能规划和执行方面，相比ChatGLM2提升了1000%；它还使国产大型模型能够原生支持工具调用、代码执行、游戏和数据库。运算、知识图谱搜索与推理、操作系统等复杂场景。

此外，ChatGLM3此次推出了可部署在手机上的端测模型ChatGLM3-1.5B和ChatGLM3-3B。支持vivo、小米、三星等多种手机及车载平台。他们甚至支持移动平台上CPU芯片的推理。速度高达 20 个令牌/秒。在准确性方面，1.5B和3B模型的性能在公共基准上接近ChatGLM2-6B模型。

基于最新的高效动态推理和内存优化技术，ChatGLM3当前的推理框架在相同的硬件和模型条件下，比目前最好的开源实现更快，包括伯克利大学推出的vLLM和最新版本的ChatGLM3。拥抱脸TGI。提升了2-3倍，推理成本也提升了一倍。每千代币仅需0.5点，成本最低。

新一代“智普轻言”上线，国内首创代码交互能力

在全新升级的ChatGLM3的赋能下，生成式AI助手智浦轻言成为国内首款具备代码交互能力的大模型产品（代码解释器）。

“代码”功能目前支持图像处理、数学计算、数据分析等使用场景。以下是：

处理数据、生成图表代码、绘制图形、上传SQL代码分析

在WebGLM大模型能力的加入下，智浦清研还具备搜索增强能力，可以帮助用户梳理相关问题的网络文献或文章链接，并直接提供答案。

此前发布的CogVLM模型提升了智浦青眼的中文图像和文本理解能力，实现了接近GPT-4V的图像理解能力。它可以回答各类视觉问题，可以完成复杂的目标检测，并添加标签完成自动数据标注。

2022年初以来，智普AI推出的GLM系列模型已支持Ascend、神威超算、海光DCU架构上的大规模预训练和推理。截至目前，智普AI产品已支持升腾、神威超算、海光DCU、海飞科、木兮兮云、计算科技、天枢智能芯、寒武纪、摩尔线程、百度昆仑芯、灵犀科技、长城等10余个国内硬件生态超云等通过与国内芯片企业联合创新，不断优化性能，有助于国产本土大机型和国产芯片尽快进入国际舞台。

智普AI推出的ChatGLM3及相关系列产品全面提升了模型性能，为行业打造了更加开放的开源生态，进一步降低了普通用户使用AIGC产品的门槛。人工智能正在引领我们进入一个新时代，大型模型必将加速这一时刻的到来。

财经科技

智谱AI发布第三代基座大模型ChatGLM3及相关产品

TCL科技等面板龙头Q3业绩超预期，Q4表现仍值期待

惠普发布战家族新品战99Monster满血高算工作站

相关文章