首页 > 科技资讯 > 智谱AI宣布GLM-4-Flash大模型开源盛典：26种语言全覆盖，中文英语日韩语皆精通

智谱AI宣布GLM-4-Flash大模型开源盛典：26种语言全覆盖，中文英语日韩语皆精通

时间：2024-08-30 04:01:19

编辑：

智谱 AI 于8月27日宣布了一项激动人心的决定，其GLM-4-Flash大模型现面向公众免费开放访问权限。用户可通过智谱 AI 的大模型开放平台直接调用该模型，这一举措无疑将促进AI技术的普及与创新应用的发展。

GLM-4-Flash 适用于完成简单垂直、低成本、需要快速响应的任务，生成速度能达到 72.14 token/s，约等于 115 字符/s。

GLM-4-Flash 具备多轮对话、网页浏览、Function Call（函数调用）和长文本推理（支持最大 128K 上下文）等功能，同时支持包括中文、英语、日语、韩语、德语等在内的 26 种语言。

官方表示，通过采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法，在推理层面实现模型的延迟降低与速度提升，更大并发量和吞吐量不仅提升了效率，而且让推理成本显著降低，从而免费推出。

在预训练方面，官方引入了大语言模型进入数据筛选流程，获得 10T 高质量多语言数据，数据量是 ChatGLM3-6B 模型的 3 倍以上；同时采用了 FP8 技术进行预训练，提高了训练效率和计算量。

智谱AI开源「清影」，引领视频生成新纪元：CogVideoX模型登场

近日消息，智谱AI最近宣布开源其尖端的视频生成模型CogVideoX，此举致力于加速视频生成技术的进步及广泛应用。CogVideoX模型依托于先进的大规模模型技术框架，其性能足以满足商业领域应用的高标准要求，开放源代码的决策有望激发创新，促进该技术在多个行业中的实际运用和发展。

智谱AI开源「清影」，引领视频生成新纪元：CogVideoX模型登场

目前开源的CogVideoX-2B版本在FP-16精度下的推理仅需18GB显存，微调则需要40GB显存，使得单张4090显卡即可进行推理，而单张A6000显卡即可完成微调。

CogVideoX模型采用了3D变分自编码器（3D VAE）技术，通过三维卷积同时压缩视频的空间和时间维度，实现了更高的压缩率和更好的重建质量。模型结构包括编码器、解码器和潜在空间正则化器，通过时间因果卷积确保了信息的因果性。此外，使用专家Transformer技术处理编码后的视频数据，结合文本输入生成高质量的视频内容。

为了训练CogVideoX模型，智谱AI开发了一套筛选高质量视频数据的方法，排除了过度编辑、运动不连贯等问题视频，确保了模型训练的数据质量。同时，通过从图像字幕生成视频字幕的管道，解决了视频数据缺乏文本描述的问题。

在性能评估方面，CogVideoX在多个指标上表现优异，包括人类动作、场景、动态程度等，以及专注于视频动态特性的评估工具。智谱AI将继续探索视频生成领域的创新，包括新型模型架构、视频信息压缩和文本视频内容融合等方面。

智谱AI宣布GLM-4-Long API正式上线，每千tokens输入输出成本低至0.001元

近日消息，智谱AI最新宣布，其支持超长上下文的LLM GLM-4-Long已在bigmodel.cn开放平台正式上线。这款模型专为驾驭超大规模文本而生，能够处理相当于两部《红楼梦》或多达125篇论文的信息量，无需分割处理。

智谱AI宣布GLM-4-Long API正式上线，每千tokens输入输出成本低至0.001元

它在长文档翻译、深度财务分析、关键信息萃取，以及构建拥有超长记忆对话能力的AI机器人等领域展现出巨大潜力，为处理复杂文本任务提供了强大工具。

GLM-4-Long在价格方面具有显著优势，输入、输出价格低至0.001元/千tokens，为企业和开发者提供了一个经济高效的解决方案。该模型在技术迭代中不断追求领先的上下文能力，从最初的2K上下文发展到目前的1M上下文长度，集成了大量长文本处理的研究成果。

在“大海捞针”评测实验中，GLM-4-Long展现了其无损信息处理的能力，证明了其在1M上下文长度中的卓越性能。此外，GLM-4-Long在财报读取、论文总结和小说阅读等方面的实际应用测试中也表现出色，能够准确摘取和分析关键信息。

GLM-4-Long的应用为企业带来了显著的优势，包括深入的对话理解、复杂文档处理、连贯性更强的内容生成以及更强的数据分析能力。这些能力在客户服务、法律、金融、科研、营销、广告和大数据分析等领域尤为重要。

智谱AI张鹏展望文生视频未来：辅助影视制作已成现实，电影革新尚需时日

近日消息，智谱CEO张鹏在最近的采访中探讨了生成式AI文生视频技术对影视产业的潜在影响，特别提及OpenAI的Sora技术问世后，该领域的话题热度持续攀升。他指出，这一技术革命在国外已引发显著反响，甚至促成好莱坞相关的行业行动，显示出技术进步对传统影视制作流程的深刻挑战与变革。

智谱AI张鹏展望文生视频未来：辅助影视制作已成现实，电影革新尚需时日

张鹏透露，自己有一次在北京电影学院与教师一同讨论此事，众人得出了一致的看法：从技术发展角度来看，大家都认为 AI 的发展“是很好的事情”，也是“很重要的方向”，对影视行业的变化有积极意义。

张鹏表示，从目前来看，“至少也觉得如果把这项技术用在直接面向最终观众的生产过程当中，可能还是不太够。”因此，（文生视频）可用来做一些辅助的工作，甚至一些小规模的创作，比如有些专业玩家玩出来的短片。但真要达到改变电影的制作等级这样的更高要求，可能还需一段路来走。

据早些时候报道，智谱宣布升级视频生成模型，并正式推出新一代产品 ——CogVideoX。CogVideoX 模型目前已在智谱清言的 PC 端、移动应用端以及小程序端正式上线。所有 C 端用户均可通过智谱清言的 AI 视频生成功能「清影」（Ying），免费体验 AI 文本生成视频和图像生成视频的服务。

智谱AI引领开源创新：CodeGeeX4-ALL-9B代码生成大模型震撼发布

近日消息，由智谱 AI 开发的 CodeGeeX 第四代模型，现已正式发布且开源。该模型属于 10B 参数以下性能最为出色、功能最为全面的代码生成大模型。自 2014 年发布第一代起，每半年便会进行一次更新，一直致力于增强代码生成的能力。

智谱AI引领开源创新：CodeGeeX4-ALL-9B代码生成大模型震撼发布

CodeGeeX提供代码补全、注释、修复、翻译等基础功能，以及联网问答、代码解释器、检索增强等高级功能，对个人用户完全免费，并在各种主流IDE中可用。个人用户数已超100万，企业版本也广泛应用于多个行业，并在中国信通院的评估中获得高评级。

CodeGeeX4系列模型的开源版本CodeGeeX4-ALL-9B，集多种编程开发功能于一体，覆盖了编程的多个场景，并在多个代码评测集上表现优异，展现了强大的代码生成能力。模型支持128K上下文，处理长代码文件，并在代码检索任务中实现100%准确度。此外，CodeGeeX4-ALL-9B是唯一实现Function Call的代码大模型，在函数调用测试中成功率超过90%。

CodeGeeX插件v2.12.0版本已全面接入第四代模型，带来更快的代码生成速度和多项功能创新，如自动生成项目README文件、长文本上下文记忆、跨文件分析和问答、本地模式支持，以及NL2SQL能力提升。这些功能增强了代码查找、理解和维护的效率，提升了开发体验。

用户可以通过升级IDE中的CodeGeeX插件或在插件市场搜索下载来体验最新技术。同时，智谱AI还发布了企业级CodeGeeX4代软硬一体机产品，提供代码仓库级补写、问答和检索增强，支持信创方案，适用于更多企业级应用场景。