Coinbase AI支出降近50%是怎么做到的？开源模型默认替换与缓存优化解析

Coinbase CEO Brian Armstrong介绍公司通过默认采用GLM 5.2、Kimi 2.7等开源权重模型，结合自动模型路由与缓存优化机制，在Token使用量增长的同时将AI支出降低近50%的具体做法。

Coinbase

AI成本优化

开源权重模型

GLM 5.2

Kimi 2.7

Coinbase CEO Brian Armstrong近期发文介绍了公司在AI成本优化方面的最新进展。随着内部AI使用量和Token消耗持续上升，Armstrong认为控制成本的关键并非限制员工使用或频繁发送预算提醒，而是优化默认模型选择、任务路由机制与缓存策略。

据其透露，Coinbase正尝试通过内部LLM网关将GLM 5.2、Kimi 2.7等开源权重模型设为默认选项，同时仍允许工程师依据具体任务需求选用其他模型。公司内部数据显示，91%的员工从未达到AI使用配额上限，因此Coinbase并未选择收紧配额，而是通过引入更低成本的模型方案来提升整体效率。

在模型路由层面，Coinbase会对提示词进行预处理，并结合缓存命中率与不同模型的定价，自动将任务分配至最合适的模型。Armstrong指出，规划与推理等复杂任务可能需要尖端模型支持，但执行类任务未必需要调用高成本模型。他同时表示，未来的模型选择流程应更多由AI自动完成，而非依赖人工决策。

Armstrong强调，缓存命中率是影响AI成本的重要因素之一。Coinbase已在请求流程中融入缓存感知机制，以提高历史结果的复用率。他以LibreChat为例说明，在优化缓存方案后，其缓存命中率已从5%提升至60%。

此外，公司要求工程师尽可能保持上下文简洁，具体做法包括切换任务时开启新会话、缩小文件上下文范围以及关闭未使用的工具，从而减少不必要的Token消耗。

Armstrong表示，通过上述措施，Coinbase已成功将AI支出降低近50%，而Token使用量仍在持续增长。

降本核心措施一览

梳理Coinbase降低AI支出的四项关键动作：一是内部LLM网关默认接入GLM 5.2与Kimi 2.7等开源权重模型，保留工程师手动切换权限；二是建立基于提示词预处理、缓存命中率与模型定价的自动路由系统；三是在请求链路中嵌入缓存感知机制，提升历史结果复用；四是要求工程师切换任务时开启新会话、关闭闲置工具并压缩文件上下文范围，减少无效Token消耗。

关键数据怎么看

文中披露三组值得关注的数据：其一，AI支出下降近50%，但Token消耗仍在增长，说明单位Token成本被显著压低；其二，91%员工未达配额上限，表明单纯限流对多数团队效果有限，替换底层模型更具性价比；其三，LibreChat缓存命中率由5%提升至60%，直接减少了重复计算带来的资源浪费。

后续可观察指标

Armstrong提到未来模型选择应由AI自动完成，而非人工决策。后续可留意其内部网关是否进一步扩展开源模型覆盖范围，以及自动路由策略能否在代码生成、规划推理等高复杂度场景中维持成本与效果的平衡。在Token用量持续攀升的背景下，缓存命中率能否继续提升也将是衡量优化空间的重要依据。

加密货币市场为什么大跌？赵长鹏：地缘冲突、AI资金分流与四年周期共同影响

币安创始人赵长鹏表示，2026年上半年加密市场显著回调并非单一原因，地缘政治紧张、资金转向AI及加密四年周期共同导致比特币等资产承压。比特币较去年10月高点12.6万美元回落约50%至6万美元附近。他认为AI吸金长期或是积极因素，并谈及预测市场、美国Clarity法案及中期选举后的监管审查可能性。

赵长鹏加密市场回调AI资金分流比特币周期Clarity法案美国监管

MSX代币怎么申领？MSX Maitong空投规则、三个月解锁周期与生态用途

MSX Maitong已开放生态代币MSX申领，总量10亿枚，首批空投分三个月解锁。用户申请后代币直接到账，但需等待现货交易开放。MSX将支持美股代币交易及Pre-IPO认购，锁仓与VIP权益仍在测试中。

MSXMSX Maitong空投申领RWA交易代币解锁Pre-IPO

比特币需求会因资本外流上升吗？Cathie Wood解析数字资产的财富保险角色

ARK Invest创始人Cathie Wood认为，不稳定国家的资本外流将为比特币带来新动力。AI虽吸引大量流动性，但无法替代数字资产作为财富保险工具的角色，资产保值与跨境配置需求或持续推升数字资产关注度。

Cathie WoodARK Invest比特币数字资产资产保值财富保险

OpenAI GPT-5.6 是什么？Sol、Terra、Luna 性能对比与定价一览

OpenAI 发布 GPT-5.6 系列预览版，包含 Sol、Terra、Luna 三款模型。Sol Ultra 模式在 Terminal-Bench 2.1 测试中得分 91.9%，定价为每百万输入 token 5 美元、输出 30 美元。该系列配备多层安全防御机制，目前仅向使用 Codex 和 API 的可信合作伙

OpenAIGPT-5.6SolTerraLuna大模型定价

降本核心措施一览

关键数据怎么看

后续可观察指标

相关资讯

加密货币市场为什么大跌？赵长鹏：地缘冲突、AI资金分流与四年周期共同影响

MSX代币怎么申领？MSX Maitong空投规则、三个月解锁周期与生态用途

比特币需求会因资本外流上升吗？Cathie Wood解析数字资产的财富保险角色

GraniteShares将推美国首只SK海力士2倍杠杆ETF，2倍做多与做空产品怎么运作？

OpenAI GPT-5.6 是什么？Sol、Terra、Luna 性能对比与定价一览

SharpLink Gaming两天再购1万枚ETH，总持仓88.6万枚为何浮亏超17亿美元？

AI是通胀推手？美联储官员卡什卡利：短期显然是推动因素