AI行业有泡沫吗?Kimi B端负责人:基本面扎实,API涨价因算力成本与芯片产能紧张

据21财经报道,月之暗面Kimi B端负责人黄振新表示,AI行业存在泡沫但基本面扎实,企业可清晰计算ROI。近期API涨价主因全球算力成本上升与芯片产能不足,评估模型性价比应关注Cache命中率,Kimi原厂Cache命中率已超90%。其Muon优化器亦被多个主流大模型采用。

  • Kimi
  • AI行业泡沫
  • API涨价
  • 算力成本
  • Cache命中率

据21财经报道,月之暗面(Moonshot AI)Kimi B端负责人黄振新在近日一场沟通会上表示,当前AI行业确实存在泡沫,但基本面非常扎实。他指出,企业目前已经能够清晰计算AI投入的回报率(ROI),由AI带来的生产力变革已经实质发生。

针对近期模型厂商普遍上调API价格的现象,黄振新指出,核心原因在于全球算力成本持续上升,且芯片产能无法满足Token需求的爆发式增长。他强调,评估模型的性价比不应仅看输入和输出的单价,更应关注Cache命中率。据悉,Kimi原厂Cache命中率目前已超过90%,能够显著降低实际算力成本。

黄振新还透露,Kimi未来将继续在底层架构上寻求创新,以延续Scaling Law。其经过大规模验证的Muon优化器,目前已被业内多个主流大模型采用。谈及企业AI落地的“最后一公里”,他认为,随着大模型基础能力持续增强,应用层的技术范式也将不断简化。

沟通会核心观点

本次沟通会主要释放三方面信息:一是AI行业虽有泡沫,但企业侧ROI已可量化,生产力提升已兑现;二是API涨价由算力成本与芯片产能瓶颈驱动,Cache命中率是衡量真实使用成本的关键指标;三是底层架构创新仍是延续模型性能增长的核心路径,Muon优化器正被行业广泛接受。

Cache命中率为何影响实际成本

在大模型推理场景中,Cache命中率是衡量计算资源复用程度的重要指标。Kimi原厂Cache命中率超过90%,意味着大量请求可命中缓存、减少重复计算,从而显著压低实际算力开销。企业在评估不同模型使用成本时,除输入输出单价外,也需将这一指标纳入考量。

后续可关注的动向

一方面,Kimi在底层架构上的持续投入能否进一步延长Scaling Law的有效期,将是观察其技术竞争力的重要窗口。另一方面,若应用层技术范式随基础模型能力增强而持续简化,企业AI落地的实施门槛和整体成本变化也值得关注。