使用token数狂多的Agent是个大泡沫！发现不对劲的公司，越来越多了很多人都

使用token数狂多的Agent是个大泡沫！发现不对劲的公司，越来越多了

很多人都发现，和大模型聊天其实开支不大，免费，或者几十块钱包月就行了。但如果搞得“专业”一些，用起Agent，那token消耗就没完了，可能是聊天机器人的100-1000倍。2025年下半年起，有一年时间了，业界最大的变化就是Agent疯狂拉爆算力，token数随便一算就觉得算力不够了。

我也玩了一段时间Agent，但感觉真正让我服气、放心的还是和大模型聊天、深度研究、文档处理、简单编程这些功能。最可气的就是那些不太靠谱，使用token还极多的Agent任务。

一个感觉是，“封装”好的任务，可以说是Agent，但它花费的token其实不算太多。例如“深度研究”，要查一个领域的许多知识，消费token会比聊天多不少。但由于封装得不错，不会漫无目的没完没了，任务有保证，输出长度可控。最后消耗token是纯聊天的几十倍，不是太离谱。而一些过分的Agent任务，消耗token会是深度研究的十倍。

这实际是一个反差。原理上来说，越是靠谱的Agent任务，它消耗的token数应该越可控。如果一个Agent任务靠谱了，AI就有“套路”了，不需要乱摸，主要信息得到了就输出。大模型公司或者应用开发人员，把这种任务封装出来，费用是可控的。

Agent的token数为啥会有“失控”的感觉？就是那些不靠谱的任务，“探索”型任务。因为不知道怎么办，就到处乱试，试来试去都不行，人也不满意，就让继续改，没完没了。最后一看，token数爆炸了，一个任务就把充的钱弄光了。

现在不少公司在鼓励用AI用agent，就说大家畅开用token，探索，谁用得最多还奖励。这是开发研究的思路，不是日常运营，还没考虑成本的事。

就比如一度火爆的小龙虾，现在不火了。用这东西去做任务，它往往是到处乱试，试来试去就胡乱交付，token数用了不少，实际干活还不如封装的“深度研究”、不如人仔细和大模型聊天收集信息。这些智能体软件，极大拉动了全球token数量需求，但实际产出难言乐观，大家都是探索，没听说什么生产力革命。

如果人们找到了一个agent的用法，能把一些任务完成得不错，但在专业高手看来，分析其内部流程，完全有极大优化空间，下回再跑用的token数能少多了。

现在业界已经发现不对劲了，有的大公司把全年的token预算都糟蹋完了。实际产出感人，多半是去探索了。

等业界风向变了，转向精打细算省token，就会有很多这方面的优化需求出来。以后大模型不仅要比做Agent任务的能力，还要比效率，用尽量少的token把事做完。还要比封装能力，做成了固化、优化流程，帮客户省token。现在大模型公司还故意浪费token来扩大营收，这是弄反了，是大泡沫。

现在都在胡乱探索Agent，搞得token数指数增长。以后改优化效率、控制token费用，绝大部分人用的是封装好的agent功能，用token数可控。真有能力的才让狂耗token探索，人不多。