DeepSeek V4 Flash连续6周霸榜全球调用量第一:国产大模型真的赢了吗?
2026-06-13 | WDSEGA
6月第一周,全球AI大模型调用量达到36.1万亿Token
OpenRouter公布的最新数据出来了。6月1日至7日,全球AI大模型总调用量36.1万亿Token,较前一周增长13.5%,连续7周上涨。
榜首是DeepSeek-V4-Flash。3.69万亿Token,环比增长19%,连续3周蝉联第一。
前四名全是国产模型:DeepSeek V4 Flash、腾讯混元Hy3、阿里Qwen3.5、字节Doubao 2.0 Pro。美国的模型被挤到了第五名以后。
这不是偶然
DeepSeek V4 Flash到底是什么来头?Flash后缀的意思是”轻量高速版”——用更少的算力跑出接近满血版的性能,成本只有满血版的1/10。
开发者用脚投票。Flash版本API价格低,响应速度快,中文理解好。做AI应用的创业公司算过账:用DeepSeek V4 Flash,一个月的API成本能从2万美元压到2000美元。
腾讯混元Hy3排第二,靠的是微信生态。无数小程序和公众号背后接的都是混元API,调用量天然大。
阿里Qwen3.5排第三,开源社区功不可没。HuggingFace上Qwen的模型下载量已经超过了Meta的Llama。
但”调用量第一”不等于”最好”
得说清楚。调用量大,可能是因为便宜,不一定是因为好用。
我拿DeepSeek V4 Flash写过代码,也拿Claude 4写过。结论:DeepSeek写Python和JavaScript确实好用,但写复杂系统设计和多文件重构,Claude 4还是更稳。
调用量是一个维度,代码质量、推理深度、多模态能力是别的维度。国产模型在”性价比”这个维度赢了,在”顶尖能力”维度还在追赶。
美国的反击会在哪里?
OpenAI还没出手。GPT-5.5据说在内部测试,性能传闻是GPT-5的3倍。谷歌的Gemini 4.0也在路上。
但DeepSeek证明了一件事:开源+性价比,可以打乱闭源商业模型的节奏。OpenAI原来可以靠技术领先收高价,现在不行了——开发者有免费的(或接近免费的)替代品,凭什么给你送钱?
这就是黄仁勋说的”软件公司要变成AI收费站”的背景:如果模型本身不赚钱,就得靠别的环节赚钱。微软靠Azure转DeepSeek流量赚了;Anthropic靠企业订阅赚了;DeepSeek靠……还不知道。
对普通开发者意味着什么?
很简单。2026年下半年,AI应用的创业成本会史无前例的低。
你可以用DeepSeek V4 Flash做主模型,用混元Hy3做中文润色,用Qwen3.5做多语言翻译,三个模型加起来的API成本,可能还不如单独用一次Claude 4。
但也要想清楚:如果所有人都能用便宜的模型做出差不多的AI应用,你的竞争壁垒在哪里?
调用量数据会骗人,但这个问题不会。
(本文基于OpenRouter 2026年6月公开数据撰写,转载请注明出处。)