日韩午夜av电影,成人免费观看在线观看,999色成人,日韩精品资源

證券日報微信

證券日報微博

您所在的位置: 網站首頁 > TMT頻道 > TMT行業 > 正文

智譜發布GLM-4.5:面向推理、代碼與智能體的開源SOTA模型

2025-07-29 09:41  來源:證券日報網 

    本報訊 (記者梁傲男)7月28日,北京智譜華章科技股份有限公司(以下簡稱“智譜”)發布新一代旗艦模型GLM-4.5,專為智能體應用打造的基礎模型。Hugging Face與ModelScope平臺同步開源,模型權重遵循MIT License。

    據悉,GLM-4.5在包含推理、代碼、智能體的綜合能力達到開源SOTA,在真實代碼智能體的人工對比評測中,實測國內最佳。

    智譜方面有關人士表示,衡量AGI的第一性原理,是在不損失原有能力的前提下融合更多通用智能能力,GLM-4.5是智譜對此理念的首次完整呈現,并有幸取得技術突破。GLM-4.5首次在單個模型中實現將推理、編碼和智能體能力原生融合,以滿足智能體應用的復雜需求。

    智譜/供圖

    記者了解到,為綜合衡量模型的通用能力,智譜選擇了最具有代表性的12個評測基準,綜合平均分,GLM-4.5取得了全球模型第三、國產模型第一,開源模型第一。

    在參數效率方面,GLM-4.5參數量為DeepSeek-R1的1/2、Kimi-K2的1/3,但在多項標準基準測試中表現得更為出色,這得益于GLM模型的更高參數效率。在衡量模型代碼能力的SWE-benchVerified榜單上,GLM-4.5系列位于性能/參數比帕累托前沿,表明在相同規模GLM-4.5系列實現了最佳性能。

    在性能優化之外,GLM-4.5系列也在成本和效率上實現突破,由此帶來遠低于主流模型定價:API調用價格低至輸入0.8元/百萬tokens,輸出2元/百萬tokens。同時,高速版本實測生成速度最高可至100 tokens/秒,支持低延遲、高并發的實際部署需求,兼顧成本效益與交互體驗。

    真實場景表現比榜單更重要。為評測GLM-4.5在真實場景Agent Coding中的效果,智譜接入Claude Code與Claude-4-Sonnet、Kimi-K2、Qwen3-Coder進行對比測試。測試采用52個編程開發任務,涵蓋六大開發領域,在獨立容器環境中進行多輪交互測試。實測結果顯示(如下圖),GLM-4.5相對其他開源模型展現出競爭優勢,特別在工具調用可靠性和任務完成度方面表現突出。盡管GLM-4.5相比Claude-4-Sonnet仍有提升空間,在大部分場景中可以實現平替的效果。

(編輯 張明富)

-證券日報網
  • 24小時排行 一周排行

版權所有《證券日報》社有限責任公司

互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證 京B2-20250455

京公網安備 11010602201377號京ICP備19002521號

證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。

證券日報社電話:010-83251700網站電話:010-83251800

網站傳真:010-83251801電子郵件:xmtzx@zqrb.net

官方客戶端

安卓

IOS

官方微信

掃一掃,加關注

官方微博

掃一掃,加關注

主站蜘蛛池模板: 萝北县| 克什克腾旗| 雅安市| 凌云县| 石嘴山市| 额济纳旗| 崇礼县| 明溪县| 宜宾市| 来安县| 铜川市| 西贡区| 大邑县| 重庆市| 曲靖市| 河源市| 剑河县| 海林市| 柘荣县| 广宗县| 石家庄市| 普兰县| 永丰县| 天水市| 沅陵县| 东丽区| 淳化县| 平塘县| 蕉岭县| 河北区| 汉阴县| 通道| 辽宁省| 肃南| 如皋市| 景宁| 绥宁县| 东山县| 定日县| 晋宁县| 通化市|