万益资讯网

使用token数狂多的Agent是个大泡沫!发现不对劲的公司,越来越多了很多人都

使用token数狂多的Agent是个大泡沫!发现不对劲的公司,越来越多了

很多人都发现,和大模型聊天其实开支不大,免费,或者几十块钱包月就行了。但如果搞得“专业”一些,用起Agent,那token消耗就没完了,可能是聊天机器人的100-1000倍。2025年下半年起,有一年时间了,业界最大的变化就是Agent疯狂拉爆算力,token数随便一算就觉得算力不够了。

我也玩了一段时间Agent,但感觉真正让我服气、放心的还是和大模型聊天、深度研究、文档处理、简单编程这些功能。最可气的就是那些不太靠谱,使用token还极多的Agent任务。

一个感觉是,“封装”好的任务,可以说是Agent,但它花费的token其实不算太多。例如“深度研究”,要查一个领域的许多知识,消费token会比聊天多不少。但由于封装得不错,不会漫无目的没完没了,任务有保证,输出长度可控。最后消耗token是纯聊天的几十倍,不是太离谱。而一些过分的Agent任务,消耗token会是深度研究的十倍。

这实际是一个反差。原理上来说,越是靠谱的Agent任务,它消耗的token数应该越可控。如果一个Agent任务靠谱了,AI就有“套路”了,不需要乱摸,主要信息得到了就输出。大模型公司或者应用开发人员,把这种任务封装出来,费用是可控的。

Agent的token数为啥会有“失控”的感觉?就是那些不靠谱的任务,“探索”型任务。因为不知道怎么办,就到处乱试,试来试去都不行,人也不满意,就让继续改,没完没了。最后一看,token数爆炸了,一个任务就把充的钱弄光了。

现在不少公司在鼓励用AI用agent,就说大家畅开用token,探索,谁用得最多还奖励。这是开发研究的思路,不是日常运营,还没考虑成本的事。

就比如一度火爆的小龙虾,现在不火了。用这东西去做任务,它往往是到处乱试,试来试去就胡乱交付,token数用了不少,实际干活还不如封装的“深度研究”、不如人仔细和大模型聊天收集信息。这些智能体软件,极大拉动了全球token数量需求,但实际产出难言乐观,大家都是探索,没听说什么生产力革命。

如果人们找到了一个agent的用法,能把一些任务完成得不错,但在专业高手看来,分析其内部流程,完全有极大优化空间,下回再跑用的token数能少多了。

现在业界已经发现不对劲了,有的大公司把全年的token预算都糟蹋完了。实际产出感人,多半是去探索了。

等业界风向变了,转向精打细算省token,就会有很多这方面的优化需求出来。以后大模型不仅要比做Agent任务的能力,还要比效率,用尽量少的token把事做完。还要比封装能力,做成了固化、优化流程,帮客户省token。现在大模型公司还故意浪费token来扩大营收,这是弄反了,是大泡沫。

现在都在胡乱探索Agent,搞得token数指数增长。以后改优化效率、控制token费用,绝大部分人用的是封装好的agent功能,用token数可控。真有能力的才让狂耗token探索,人不多。