首頁

阿里千問3推理模型重磅更新比肩Gemini-2.5 pro、o4-mini

2025-07-25 19:23 來源：證券日報網

本報訊（記者梁傲男）7月25日，阿里巴巴集團控股有限公司（以下簡稱“阿里”）全新開源千問3推理模型，性能大幅提升，一舉奪下“全球最強開源模型”王座，比肩頂級閉源模型Gemini-2.5pro、o4-mini。本周，阿里已連續開源3款重磅模型，分別斬獲基礎模型、編程模型、推理模型等主流領域的三項全球開源冠軍。兩天前開源的AI編程模型Qwen3-Coder，更是引爆全球AI圈，掀起一波用中國千問開源模型替代閉源模型的新浪潮。

最新推出的千問3推理模型，登頂全球最強開源推理模型。自千問3旗艦模型Qwen3-235B-A22B發布后，阿里通義團隊一直在擴展大模型的推理極限，全新開源的千問3推理模型在通用能力和深度思考能力上實現巨大飛躍。千問3推理模型支持256K上下文長度，在知識（SuperGPQA）、編程（LiveCodeBenchv6）、數學（AIME25）、人類偏好對齊（Arena-Hardv2）、創意寫作（WritingBench）、多語言能力（MultilF）等核心能力上，千問3推理模型完全可比肩Gemini-2.5pro、o4-mini等頂尖閉源模型，并創下全球開源模型的最佳性能表現。

3天前開源的Qwen3-235B-A22B-Instruct-2507（非思考版）新模型，性能顯著提升，在GPQA（知識）、AIME25（數學）、LiveCodeBench（編程）、Arena-Hard（人類偏好對齊）、BFCL（Agent能力）等眾多測評中表現出色，超越Claude4（Non-thinking）等領先閉源模型。權威AI研究機構ArtificialAnalysis指出，“千問3是全球最智能的非思考基礎模型”。

在AI編程領域，新開源的Qwen3-Coder被譽為“全球最好的編程模型”。Qwen3-Coder在代碼能力及Agent調用能力方面取得重大突破。在多語言SWE-bench、Mind2Web、Aider-Polyglot等模型Agent能力評估中，Qwen3-Coder超越GPT4.1、Claude4等頂級閉源模型，并登頂全球最大AI開源社區HuggingFace模型總榜冠軍。借助Qwen3-Coder，剛入行的程序員一天就能完成資深程序員一周的工作，生成一個品牌官網最快只需5分鐘。

Qwen3-Coder的開源，引爆硅谷科技圈，在全球AI圈掀起一波“AI編程”熱潮。海外知名模型API聚合平臺OpenRouter數據顯示，阿里千問API調用量暴漲，過去幾天已突破1000億Tokens，在OpenRouter趨勢榜上包攬全球前三，是當下最熱門的模型。

截至目前，阿里已開源300余款通義大模型，通義千問衍生模型突破14萬個，超越Meta的Llama系列成為全球第一的開源模型家族，通義也是開發者和企業使用最廣泛的大模型。未來三年，阿里巴巴還將投入超過3800億元用于建設云和AI硬件基礎設施，持續升級全棧AI能力，為中國和全球開發者和企業提供更先進的模型和云計算服務。

（編輯郭之宸）

-證券日報網

熱點新聞

從“2025中國企業500強”看中國經濟的穩與進

地方國資并購基金“潮涌” 加速賦能產業升級

金秋促消費持續上“新” 市場活力倍增

工程機械行業穩步邁入新一輪增長周期

24小時排行一周排行

深度策劃

衛星通信萬億賽道起飛，手機直連時代開啟

衛星通信管理制度及政策法規進一步完善……[詳情]

市場快訊

09:53	央行副行長陸磊：支付產業要加快推...
23:56	浙江土地市場高溢價成交頻現
23:56	政策組合拳為儲能產業鏈打開發展空...
23:56	工程機械企業要握緊高質量發展的四...
23:56	工程機械行業穩步邁入新一輪增長周...
23:48	龍蟠科技簽下60億元磷酸鐵鋰正極材...
23:48	巨星傳奇擬收購“鳥巢”運營主體1....
23:48	露笑科技子公司簽署AI機器人領域合...
23:48	雅化集團：“民爆+鋰業”雙主業齊...
23:35	商品期貨沉淀資金量站上4700億元關...
23:35	年內62家機構申報合格境外投資者資...
23:35	銀行秋季招聘加碼爭奪金融科技人才

日韩午夜av电影,成人免费观看在线观看,999色成人,日韩精品资源

阿里千問3推理模型重磅更新 比肩Gemini-2.5 pro、o4-mini

阿里千問3推理模型重磅更新比肩Gemini-2.5 pro、o4-mini