刚刚,智谱一口气开源6款模型,200 tokens/秒解锁商用速度之最 | 免费

刚刚,智谱开源了六款最新的GLM模型,其中推理模型GLM-Z1-32B-0414实现了200 tokens/秒的推理速度,是国内商业模型中速度最快,并且性价比高。

智谱还上线了多个版本的基座和推理模型,提供API服务,其中GLM-Z1-AirX推理模型速度最快,GLM-4-Flash-250414基座模型完全免费。

此外,智谱还获得了顶级域名Z.ai,并上线了三款模型。

[原文链接]

上一篇:

下一篇:

微信