本報訊 (記者梁傲男)7月25日,阿里巴巴集團控股有限公司(以下簡稱“阿里”)全新開源千問3推理模型,性能大幅提升,一舉奪下“全球最強開源模型”王座,比肩頂級閉源模型Gemini-2.5pro、o4-mini。本周,阿里已連續開源3款重磅模型,分別斬獲基礎模型、編程模型、推理模型等主流領域的三項全球開源冠軍。兩天前開源的AI編程模型Qwen3-Coder,更是引爆全球AI圈,掀起一波用中國千問開源模型替代閉源模型的新浪潮。
最新推出的千問3推理模型,登頂全球最強開源推理模型。自千問3旗艦模型Qwen3-235B-A22B發布后,阿里通義團隊一直在擴展大模型的推理極限,全新開源的千問3推理模型在通用能力和深度思考能力上實現巨大飛躍。千問3推理模型支持256K上下文長度,在知識(SuperGPQA)、編程(LiveCodeBenchv6)、數學(AIME25)、人類偏好對齊(Arena-Hardv2)、創意寫作(WritingBench)、多語言能力(MultilF)等核心能力上,千問3推理模型完全可比肩Gemini-2.5pro、o4-mini等頂尖閉源模型,并創下全球開源模型的最佳性能表現。
3天前開源的Qwen3-235B-A22B-Instruct-2507(非思考版)新模型,性能顯著提升,在GPQA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)、BFCL(Agent能力)等眾多測評中表現出色,超越Claude4(Non-thinking)等領先閉源模型。權威AI研究機構ArtificialAnalysis指出,“千問3是全球最智能的非思考基礎模型”。
在AI編程領域,新開源的Qwen3-Coder被譽為“全球最好的編程模型”。Qwen3-Coder在代碼能力及Agent調用能力方面取得重大突破。在多語言SWE-bench、Mind2Web、Aider-Polyglot等模型Agent能力評估中,Qwen3-Coder超越GPT4.1、Claude4等頂級閉源模型,并登頂全球最大AI開源社區HuggingFace模型總榜冠軍。借助Qwen3-Coder,剛入行的程序員一天就能完成資深程序員一周的工作,生成一個品牌官網最快只需5分鐘。
Qwen3-Coder的開源,引爆硅谷科技圈,在全球AI圈掀起一波“AI編程”熱潮。海外知名模型API聚合平臺OpenRouter數據顯示,阿里千問API調用量暴漲,過去幾天已突破1000億Tokens,在OpenRouter趨勢榜上包攬全球前三,是當下最熱門的模型。
截至目前,阿里已開源300余款通義大模型,通義千問衍生模型突破14萬個,超越Meta的Llama系列成為全球第一的開源模型家族,通義也是開發者和企業使用最廣泛的大模型。未來三年,阿里巴巴還將投入超過3800億元用于建設云和AI硬件基礎設施,持續升級全棧AI能力,為中國和全球開發者和企業提供更先進的模型和云計算服務。
(編輯 郭之宸)
09:53 | 央行副行長陸磊:支付產業要加快推... |
23:56 | 浙江土地市場高溢價成交頻現 |
23:56 | 政策組合拳為儲能產業鏈打開發展空... |
23:56 | 工程機械企業要握緊高質量發展的四... |
23:56 | 工程機械行業穩步邁入新一輪增長周... |
23:48 | 龍蟠科技簽下60億元磷酸鐵鋰正極材... |
23:48 | 巨星傳奇擬收購“鳥巢”運營主體1.... |
23:48 | 露笑科技子公司簽署AI機器人領域合... |
23:48 | 雅化集團:“民爆+鋰業”雙主業齊... |
23:35 | 商品期貨沉淀資金量站上4700億元關... |
23:35 | 年內62家機構申報合格境外投資者資... |
23:35 | 銀行秋季招聘加碼爭奪金融科技人才 |
版權所有《證券日報》社有限責任公司
互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證 京B2-20250455
京公網安備 11010602201377號京ICP備19002521號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關注
掃一掃,加關注