DeepSeek V4 Flash连续6周霸榜全球调用量第一：国产大模型真的赢了吗？

2026-06-13 编译员：编译员时事新闻

6月第一周，全球AI大模型调用量达到36.1万亿Token

OpenRouter公布的最新数据出来了。6月1日至7日，全球AI大模型总调用量36.1万亿Token，较前一周增长13.5%，连续7周上涨。

榜首是DeepSeek-V4-Flash。3.69万亿Token，环比增长19%，连续3周蝉联第一。

前四名全是国产模型：DeepSeek V4 Flash、腾讯混元Hy3、阿里Qwen3.5、字节Doubao 2.0 Pro。美国的模型被挤到了第五名以后。

DeepSeek V4 Flash到底是什么来头？Flash后缀的意思是”轻量高速版”——用更少的算力跑出接近满血版的性能，成本只有满血版的1/10。

开发者用脚投票。Flash版本API价格低，响应速度快，中文理解好。做AI应用的创业公司算过账：用DeepSeek V4 Flash，一个月的API成本能从2万美元压到2000美元。

腾讯混元Hy3排第二，靠的是微信生态。无数小程序和公众号背后接的都是混元API，调用量天然大。

阿里Qwen3.5排第三，开源社区功不可没。HuggingFace上Qwen的模型下载量已经超过了Meta的Llama。

得说清楚。调用量大，可能是因为便宜，不一定是因为好用。

我拿DeepSeek V4 Flash写过代码，也拿Claude 4写过。结论：DeepSeek写Python和JavaScript确实好用，但写复杂系统设计和多文件重构，Claude 4还是更稳。

调用量是一个维度，代码质量、推理深度、多模态能力是别的维度。国产模型在”性价比”这个维度赢了，在”顶尖能力”维度还在追赶。

OpenAI还没出手。GPT-5.5据说在内部测试，性能传闻是GPT-5的3倍。谷歌的Gemini 4.0也在路上。

但DeepSeek证明了一件事：开源+性价比，可以打乱闭源商业模型的节奏。OpenAI原来可以靠技术领先收高价，现在不行了——开发者有免费的（或接近免费的）替代品，凭什么给你送钱？

这就是黄仁勋说的”软件公司要变成AI收费站”的背景：如果模型本身不赚钱，就得靠别的环节赚钱。微软靠Azure转DeepSeek流量赚了；Anthropic靠企业订阅赚了；DeepSeek靠……还不知道。

很简单。2026年下半年，AI应用的创业成本会史无前例的低。

你可以用DeepSeek V4 Flash做主模型，用混元Hy3做中文润色，用Qwen3.5做多语言翻译，三个模型加起来的API成本，可能还不如单独用一次Claude 4。

但也要想清楚：如果所有人都能用便宜的模型做出差不多的AI应用，你的竞争壁垒在哪里？

调用量数据会骗人，但这个问题不会。

（本文基于OpenRouter 2026年6月公开数据撰写，转载请注明出处。）