![]()
今年以来,当头部的大模型厂商在围绕模型迭代、产品力、融资、上市等集体抢占时间窗口时,商业化这个命题也被悄然塞进了他们的时间表里。
结合近期Kimi对外的披露,以及与月之暗面Kimi B端负责人黄震昕的交流,可以梳理出这家公司在商业化路径上的一系列战略选择与自我定位。
在过去两年间,Kimi首次大规模应用二阶优化器Muon取代了已成为行业标准10年之久的Adam优化器,推出基于KDA注意力机制的Kimi Linear架构,以及推出注意力残差方案,对计算效率得以大幅提升。
关于Harness,Kimi的判断是:随着基础模型变强,对外部复杂Harness的要求会降低,类似去年Prompt工程热度的下降。因此Kimi内部已开始实践Loop Engineering(循环工程)。
黄震昕认为,随着Token市场价格走高,用户对于高性能的Token需求仍有支付意愿,同时,虽然由于芯片荒和算力成本上升导致成本在涨,但模型厂商也在通过技术优化,将Token的实际成本往下降低。
在定价策略上,Kimi的定位是做高性能模型,而非最便宜的模型。尤其是伴随今年模型价格的集体上涨,背后核心原因仍然是全球算力供应跟不上Token需求增长。为此,Kimi对冲成本压力的方式是通过技术优化,其KV-Cache命中率达到90%以上。
“评估模型价格不能只看输入输出定价,还要看KV-Cache命中率。只要命中,成本就会降很多,能给用户节省成本。” 黄震昕告诉笔者。
作为Kimi B端负责人,黄震昕还着重提及了Kimi在To B业务的布局,包括三层服务体系:模型层提供K2.7 Code、K2.6等基础模型;架构层提供API及Agent SDK;产品层推出企业版,包含Kimi Agent集群、Kimi Code、Kimi Work等工具。黄震昕指出,Kimi不会做太重的交付工作,“模型本身还有大量技术难题待攻克,Kimi能把模型做好已经非常不易。”
对于企业级应用所需的“最后一公里”服务,Kimi选择通过FDE合作伙伴来完成端到端交付,而非自建重服务团队。在行业解决方案层面,Kimi也在尝试与亚马逊云科技等合作构建金融、医疗、制造等垂直场景的方案,前者提供模型能力,而后者主要提供行业经验与客户资源。
以下是黄震昕在亚马逊云科技中国峰会上的演讲全文。
我是月之暗面(Moonshot AI)的黄震昕,负责公司的B端业务。很高兴能在亚马逊云科技中国峰会上和大家分享我们的思考。
我加入月之暗面时,就被一个愿景所吸引:致力于寻找将能源转化为智能的最优解。为什么选择这个命题?人类历史上有三次真正的能源变迁。第一次是我们学会了利用阳光,第二次是我们发掘了煤炭,第三次,也就是现在,我们正在学习如何将能源高效地转化为智能。前两次转化是线性的、有限的,而这一次转化是可逆的、可扩展的、可存储的。
关于实现这一最优解,我们的目标一直是做出全球领先的模型。因此,对于月之暗面来说,扩大模型规模(Scaling)是一个必选项。大家从新闻中也了解到,我们近期完成了规模不小的融资,但和海外同行相比,这笔资金并不算多。因此,我们致力于找到效率的最优解。
为此,我们选择了三个技术方向,因为它们对应了智能体的三个核心能力维度:聪明程度、干活时长(Long Context)和协作能力(Agent Swarm)。
第一,聪明程度。数据并非无限,在相同的算力下,谁能学得更聪明,谁就更具优势。
第二,干活时长。这决定了模型如何能处理更长时间的任务,同时不忘记最初的目标是什么。
第三,协作能力。单个智能体再强大,也有其局限性。如何让多个智能体有效组队,协作完成复杂的用户任务,是另一个关键。
这三个维度结合起来,就是AI产品能力的整体体现。自2025年以来,我们在这三个方向上都取得了关键突破。大家可以看到,Kimi的每一项创新,都瞄准了最基础的模型架构,而不仅仅是工程效率的优化。
以优化器为例,经典的Adam优化器诞生于11年前,我们将一种新的优化技术运用到了大部分训练中,使实际数据的使用效率提升了27%,整体效率直接翻倍。在长文本(Long Context)方面,传统的Attention架构诞生于八年前,我们推出了Kimi Linear Attention技术,将在下一代模型中应用。传统架构下,模型扩大十倍,训练和推理成本将扩大一百倍;而采用新技术后,仅需十倍的算力即可实现。此外,残差连接技术诞生于十年前,我们推出了注意力残差(Attention Residual)技术,使效率提升了25%。
马斯克也曾专门为我们的技术点赞。可以说,模型的规模瓶颈正在被我们逐一解决,更大规模、更高质量的模型成为可能。一个行业常识是,KV缓存命中率很大程度上影响用户的最终使用成本。我们通过研发Kimi的工程优化,持续提升效率,降低KV缓存失效率,从而降低了API的使用成本,让更多用户能够用得起。
最近,我们也发布了Kimi K2.7,其代码能力大幅提升。我们还特别推出了高速版本,输出速度达到了180 token/秒。很多朋友反馈,用上之后就再也回不去了。这也是我们努力通过推理优化提升客户体验的例证。
Kimi是一家注重审美的公司,我们的品牌调性很明确,专注于生产力领域。我们把有限的能源和算力,集中在学术研究、软件工程、复杂推理等领域。长期使用的用户会发现,我们的核心场景始终围绕着提升生产力。
大家可能对Kimi的印象更多停留在To C端,但其实我们在To B领域也并非简单地售卖API,而是提供了一整套完整的生产力赋能体系。该体系具备三层能力:
模型层:Kimi持续做最强的基础模型。目前底座已涵盖K2.7 Code、K2.6和K2.5等模型,为企业级应用提供坚实的智能底座。
服务层:Kimi提供丰富的API,开发者可以借此进行深度集成,将Kimi的能力无缝嵌入到企业自身的工作流中,例如网页搜索、PPT生成等。
工具/产品层:Kimi提供包括Kimi Agent集群、Kimi Code、Kimi Claw、Kimi Work等开箱即用的产品。该层级直接解决企业真实场景中的复杂问题,例如让Agent自动处理报表、生成行业分析、管理项目文档等。
在全球化业务拓展方面,Kimi正携手亚马逊云科技推进全球业务协同,借助其从基础设施层到应用落地层面的全方位助力,实现全球化规模加速,为全球企业赋能生产力:
基础设施和服务层面:Kimi运行在亚马逊云科技遍布全球的数据中心和网络基础设施上,获得了稳定可靠的算力支持,确保模型运行得又快又稳。Kimi多个模型现已登陆Amazon SageMaker,让更多开发者可以进行模型的训练与推理,大幅降低使用门槛。同时,Amazon Bedrock已经接入了Kimi K2.5等开源模型,未来Kimi正在积极推进接入更多最新模型,让用户无需自行管理基础设施或单独部署服务器就能使用Kimi模型。此外,Amazon Bedrock Guardrails的企业级安全能力也将自动适用于Kimi,提供有害内容过滤、提示词攻击防护以及企业合规保障。
业务合作层面:Kimi已登陆亚马逊云科技Marketplace,直接触达全球数百万活跃企业客户。全球客户可以通过该数字软件市场简化采购流程,实现一键使用、按量付费与零门槛接入。同时,借助APN合作伙伴网络,Kimi正在快速拓展企业客户。
垂直行业层面:Kimi与亚马逊云科技联合打造行业解决方案,已覆盖金融、医疗、制造等垂直行业场景。在合作中,Kimi提供核心大模型,亚马逊云科技发挥其丰富的行业经验与客户资源,共同将Kimi的能力无缝嵌入到企业的真实业务流程中。
以上就是今天的分享。我们期待与亚马逊云科技携手,继续探索将能源转化为智能的最优解。
(作者 | 杨丽,编辑 | 杨林)







快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论