智譜(02513)宣布,面向部分企業客戶開放GLM-5.1高速版API,模型輸出速度達每秒400 tokens。
公司稱,實測數據顯示,高速版能力突出,代碼生成效率提升約10倍,可同步理解工程上下文並輸出方案;3D場景建模可實現文字輸入與場景即時聯動;還能即時生成匹配需求的工具與交互,具備新型作業系統雛形。而今次發布的高速版亦毋須為回應速度犧牲模型質量,可實現「即問即答」,改變傳統模型多輪調用耗時久的痛點。
該API由智譜GLM團隊與TileRT團隊聯合打造,經推理引擎、調度系統、基礎設施三層優化。其核心突破在於TileRT引擎,通過編譯期靜態編排與Tile級微任務調度,消除冗餘開銷,逼近硬件物理極限。目前,GLM-5.1高速版已適配AI編程、實時交互、商業決策、即時語音等高敏感場景,在智譜MaaS平台定向開放。
智譜稱,未來將持續優化推理引擎,擴大高速服務覆蓋,為企業提供低延遲、高智能的生產級AI能力,鞏固國產大模型在全球技術前沿的領先地位。
《經濟通通訊社22日專訊》
【你點睇?】據報英國首相施紀賢正考慮辭任,你認為英國政局短期內會否持續動盪? ► 立即投票





















