本報訊 (記者梁傲男)7月30日,記者從北京智譜華章科技股份有限公司(以下簡稱“智譜”)獲悉,智譜發布的新一代旗艦模型GLM-4.5登頂HuggingFace Trending榜單。
智譜/供圖
據記者了解,GLM-4.5參數量為DeepSeek-R1的二分之一、Kimi-K2的三分之一,但在多項標準基準測試中表現得更好,得益于模型更高的參數效率。在性能優化之外,GLM-4.5系列也在成本和效率上實現突破:API調用價格低至輸入價格為0.8元/百萬tokens,輸出價格2元/百萬tokens,大幅低于目前主流的模型定價。
在性能評估中,GLM-4.5的表現展示了其架構優勢。在涵蓋研究生水平推理和復雜軟件工程解題等12項全球公認的硬核測試中,其綜合得分位列全球第三,在所有國產模型和開源模型中均排名第一。
智譜方面表示,大語言模型的目標是在廣泛領域達到人類認知水平,而非針對特定任務而設計專家模型。一個優秀的大語言模型必須具備通用問題解決、泛化能力、常識推理和自我改進等核心能力。過去五年里,OpenAI的GPT-3學會了常識知識,而o1模型則通過強化學習實現了“先思考后回答”,在編程、數據分析和復雜數學問題上的推理能力得到了顯著提升。然而,現有模型仍然算不上真正的通用模型:有些擅長編程,有些精于數學,有些在推理方面表現出色,但沒有一個能在所有任務上都達到最佳表現。GLM-4.5正是朝著統一各種能力這一目標努力,力求在一個模型中集成所有這些不同的能力。
目前,智譜GLM-4.5模型系列已上線超算互聯網AI社區,包括GLM-4.5和GLM-4.5-Air的基礎模型、混合推理模型以及混合推理模型的FP8版本。企業和開發者均可在AI社區快速下載模型文件進行部署、微調開發。
(編輯 郭之宸)
09:53 | 央行副行長陸磊:支付產業要加快推... |
23:56 | 浙江土地市場高溢價成交頻現 |
23:56 | 政策組合拳為儲能產業鏈打開發展空... |
23:56 | 工程機械企業要握緊高質量發展的四... |
23:56 | 工程機械行業穩步邁入新一輪增長周... |
23:48 | 龍蟠科技簽下60億元磷酸鐵鋰正極材... |
23:48 | 巨星傳奇擬收購“鳥巢”運營主體1.... |
23:48 | 露笑科技子公司簽署AI機器人領域合... |
23:48 | 雅化集團:“民爆+鋰業”雙主業齊... |
23:35 | 商品期貨沉淀資金量站上4700億元關... |
23:35 | 年內62家機構申報合格境外投資者資... |
23:35 | 銀行秋季招聘加碼爭奪金融科技人才 |
版權所有《證券日報》社有限責任公司
互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證 京B2-20250455
京公網安備 11010602201377號京ICP備19002521號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關注
掃一掃,加關注