
“Token的消耗量确实在激增,但这种高昂的投入与终端用户体验的实质性提升之间,尚未建立起清晰的逻辑关联。目前很难在AI成本支出与功能产出之间,划出一道令人信服的等号。”
这段话在技术圈传开以后,不少的开发者表示,心里那股焦虑终于被人讲出来了。
这件事在内部引发了一场大讨论,核心矛盾就一个:疯狂燃烧的Token账单和持续膨胀的人力成本并没有换来预期的增长,消费者端真正落地的功能,甚至没有多出25%。
Uber之外,类似的信号越来越多。据Axios报道,一家大客户单月在Claude上花掉了5亿美元,只因公司没有给员工的许可证设用量上限。
同一时间,微软被曝取消了大部分Claude Code许可证,转向更可控的内部方案。CloudBees CEO Anuj Kapur说得更直白:裁员可能是企业抵消AI账单的唯一手段。
Uber CTO烧光的预算、微软砍掉的许可、客户5亿美元的账单,这三件事拼在一起,指向一个简单的事实,那就是AI用着确实顺手,但账单寄到CFO桌上的时候,故事就变了。
把视野从Uber一家拉到整个行业,2026年大厂们在AI上押的注,已经到了让人喘不过气的规模。
这些钱主要砸在数据中心、GPU和海量服务器上。高盛等机构预测,Agentic AI时代到来后,Token消耗量可能再翻24倍。
多家投行分析师已经做出预测:2025到2030年间,大部分hyperscaler的AI资本回报率大概率是负的,只有少数能勉强回正。
Gary Marcus在Substack上连发数文,2023年他就开始质疑生成式AI的经济性,2025年喊出“泡沫顶峰”,2026年干脆称之为清算年。
他的逻辑不复杂,炒作太多,真实商业价值太少,Scaling Law已经跑到了边际递减区间。如果更多财富500强公司报出类似Uber的“高投入、低产出”,泡沫就该破了。
当然,也有人不悲观。Yann LeCun和Andrew Ng都表达过类似判断:AI会改变世界,但当前这条无限堆算力、无限烧Token的路,必须调整。更高效的架构、更聪明的数据利用,才有出路。
云厂商开始调API定价模型、收紧配额、砍掉无限量套餐。而最先感受到这股寒意的,就是每天坐在终端前面、一行行调prompt的开发者。
但只要开了Agent模式或者Claude Code Max,月费轻松冲到100到400美元。直接调API用Opus级模型的话,一个复杂项目的调试跑下来,单次几美元到几十美元很常见。
一个做SaaS的开发者上个月AI写新功能,Token费花了280美元。功能是上线了,但代码review花的时间比以前还多。
AI生成的逻辑“看着对,一跑就出坑”。整体开发效率确实提了,但边际收益在递减。
很多独立开发者都在反馈同一个现象:做多文件重构、长上下文Agent任务时,重复加载上下文和无效循环修正,能吃掉30%到60%的Token。你以为买的是生产力,实际有三成到一半都在空气里烧掉了。
在有经验的开发者身上,AI辅助有时候反而拉长了完成时间,纠错成本太高。AI把初级活干了,架构、审查、调试这些高级活还是得人来。审查AI代码,有时候比自己从头写还累。
优化后做了两件事:文件导航和模板代码切到Haiku,核心逻辑用Sonnet,只有架构决策才上Opus;稳定system prompt加代码库前缀做缓存,重复输入只收10%费用。同样任务的Token降到5.5万,单月成本约6.8美元,节省了73%。
一个开发者按这个思路,把每月340美元的Cursor账单压到了85美元上下,交付速度反而没掉。少了无效循环,效率反而高了。
每天补几个函数、写几组单测、修几个不痛不痒的bug。默认Sonnet、全量上下文、不开缓存,一个任务随便就烧掉4.5万token。
一天15个、月工作22天,总token直奔1500万,月成本280到320美元,重度用户大多落在这个区间。如果80%的琐碎活切到Haiku加缓存,prompt里写“只输出代码,不解释”,Token直接压到原来三分之一,月成本降到65到85美元,节省了约75%。
模型分层。简单活Haiku,日常Sonnet,复杂架构才上Opus。别拿牛刀杀鸡。
Prompt Caching。重复上下文缓存能省75%到90%的输入费用。system prompt、代码库前缀,这些固定内容一定要缓存。
本地模型混用。隐私敏感或高频简单任务,用Ollama跑Llama 3.1或DeepSeek,成本压到每月50美元以内。
设token上限。用治理工具给单次会话设天花板,防止Agent跑飞了还在烧。
国产大模型在成本和合规上越来越能打,边缘部署和混合云方案也在快速成熟。未来企业很可能更偏好「够用、便宜、可控」的组合,纯押国外闭源顶级模型不再是唯一的路。
最近这股从狂热转向焦虑的情绪,有点像从一个极端跳到了另一个极端。去年FOMO到什么都上AI,今年一看账单又集体紧张。
互联网泡沫破裂后,死掉的是炒概念的公司,活下来的成了今天的巨头。AI也会走同样的路。能帮企业真正省钱、赚钱的技术,成本优化、可靠Agent、垂直领域应用,才会留下来。
对开发者来说,这段时间反而是个好时机。别被宏观叙事带节奏,沉下心把几件事做扎实:
最关键的一项:怎么高效review AI代码,把AI输出转化成可靠产品。这个能力,2026年以后只会越来越值钱。
Uber的案例、Gary Marcus的警告,都在说同一件事:技术要服务业务,工具要匹配成本。这个道理并不新鲜,只是AI这两年发展得太快,很多人来不及想。但能确定的是,那些会精打细算使用AI的开发者,不管泡沫破不破,都站得更稳。
你们最近用AI开发,最大的痛点在哪?token费爆过表吗?有没有自己摸索出来的省钱办法?欢迎在留言区聊聊。
在线客服
电话咨询


官方微信
返回顶部