9月24日下午消息,2025云棲大會上,阿里宣布通義旗艦模型Qwen3-Max發布,性能超過GPT5、Claude Opus 4等,躋身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)兩大版本,其預覽版已在Chatbot Arena排行榜上位列第三,正式版性能有望再度實現突破。
據悉,Qwen3-Max為通義千問家族中最大、最強的基礎模型。該模型預訓練數據量達36T tokens,總參數超過萬億,擁有極強Coding編程能力和Agent工具調用能力。在大模型用Coding解決真實世界問題的SWE-Bench Verified測試中,Instruct版本斬獲69.6分,位列全球第一梯隊;在聚焦Agent工具調用能力的Tau2-Bench測試中,Qwen3-Max取得突破性的74.8分,超過Claude Opus4和DeepSeek-V3.1。
Qwen3-Max的推理增強版本Qwen3-Max-Thinking-Heavy,結合工具調用和并行推理技術推理能力創下新高,在聚焦數學推理的AIME 25和HMMT測試中,均達到滿分100分。
目前,通義千問系列模型已經實現從0.5B到超萬億的全尺寸覆蓋,包含三百多個大模型,可滿足不同場景的需求。即日起,用戶可在通義千問QwenChat上免費體驗Qwen3-Max,也可通過阿里云百煉平臺調用API服務。