
2026年5月20日,阿里巴巴云峰会上,通义千问Qwen3.7-Max正式亮相。这款被阿里称为”面向智能体时代的新一代旗舰大模型”,在Arena全球大模型盲测总榜中超越Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,位列国产模型第一。
更令人震惊的是其核心亮点——35小时智能体自主进化能力。这意味着AI不再只是被动回答问题,而是能够主动学习、自我优化。
| 模型 | Arena排名 | 数学能力 | 编程能力 | 多模态 |
|---|---|---|---|---|
| GPT-4o | Top 3 | 全球Top 5 | 全球Top 3 | 优秀 |
| Claude 4 | Top 2 | 全球Top 3 | 全球Top 2 | 优秀 |
| Qwen3.7-Max | 国产第1 | 全球第7 | 国产第1 | 全面升级 |
| Kimi-K2.6 | 国产第3 | 良好 | 良好 | 良好 |
| DeepSeek-v4-pro | 国产第2 | 优秀 | 优秀 | 良好 |
1. 智能体自主进化
这是Qwen3.7-Max最具革命性的能力。模型能够在35小时内:
2. 编程能力大幅提升
在HumanEval、MBPP等主流编程基准测试中,Qwen3.7-Max取得了国产最佳成绩:
# 示例:Qwen3.7-Max的代码生成能力
# 输入:用Python实现一个高性能的LRU缓存
from functools import lru_cache
from collections import OrderedDict
import threading
class LRUCache:
"""线程安全的LRU缓存实现"""
def __init__(self, capacity: int):
self.capacity = capacity
self.cache = OrderedDict()
self.lock = threading.Lock()
def get(self, key):
with self.lock:
if key not in self.cache:
return -1
self.cache.move_to_end(key)
return self.cache[key]
def put(self, key, value):
with self.lock:
if key in self.cache:
self.cache.move_to_end(key)
self.cache[key] = value
if len(self.cache) > self.capacity:
self.cache.popitem(last=False)
3. 多模态理解升级
支持文本、图像、视频、音频的统一理解,在多模态基准测试中表现优异。
4. 推理能力突破
在数学推理、逻辑推理等任务中,Qwen3.7-Max展现了接近GPT-4o的水平。
5. 工具调用生态
内置丰富的工具调用能力,支持:
6. 全栈AI方案
搭配平头哥自研真武M890 AI芯片,形成”芯片-模型-云服务”全栈能力。
阿里在AI领域的投入可以追溯到2018年达摩院的成立。经过多年的积累,阿里在AI领域的优势逐渐显现:
相比其他国产大模型,Qwen3.7-Max的独特之处在于:
Qwen3.7-Max可以自主处理复杂的客户服务场景:
作为编程助手,Qwen3.7-Max可以:
结合阿里云的数据处理能力:
Qwen3.7-Max的发布,标志着国产大模型竞争进入新阶段:
| 厂商 | 旗舰模型 | 核心优势 | 主要短板 |
|---|---|---|---|
| 阿里 | Qwen3.7-Max | Agent能力、全栈方案 | 国际影响力 |
| 字节 | 豆包 | C端应用、推荐算法 | B端生态 |
| 百度 | 文心一言 | 中文理解、搜索集成 | 编程能力 |
| 智谱 | GLM-5.1 | 学术背景、多模态 | 商业化 |
| DeepSeek | v4-pro | 开源、性价比 | 产品化 |
阿里云已开放Qwen3.7-Max的API接口:
# 通过阿里云API调用Qwen3.7-Max
curl -X POST https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-max",
"input": {
"messages": [
{"role": "user", "content": "帮我分析这份销售数据"}
]
},
"parameters": {
"max_tokens": 2000,
"temperature": 0.7
}
}'
经过实际测试,Qwen3.7-Max在以下场景表现突出:
✅ 优势场景:
⚠️ 待改进:
Qwen3.7-Max的发布,不仅是阿里在AI领域的一次重要里程碑,更是国产大模型整体实力提升的缩影。35小时自主进化的能力,让我们看到了AI从”工具”向”伙伴”转变的可能。
💡 关注我的博客,获取更多AI大模型评测和深度分析!