随着大模型发展进入深水区,行业正在从“拼模型”转向“拼Token质量”。5月20日,人工智能Token(词元)生产服务商趋境科技宣布完成数亿元 Pre-A 轮融资。
随着大模型应用进入企业生产环境,AI(人工智能)推理基础设施的评价标准正在发生变化:企业不再只关注算力规模、模型数量和接口丰富度,而是更加看重每一次调用能否稳定、高效、可预期地完成业务交付。 在这一阶段,推理服务的核心竞争力正在从“提供模型”转向“生产高品质 Token”。每秒Token输出量、输出稳定性、高并发场景下服务质量的可预测性等,正在成为企业选择 AI 基础设施的重要指标。
趋境科技相关负责人表示,Token已不只是大模型输入输出的基本单位,而是连接模型能力、系统性能、服务稳定性与成本效率的关键生产要素。基于这一判断,该团队提出Token即服务的产业理念,并建设了高效能人工智能Token生产服务平台ATaaS。相较于传统MaaS(Model as a Service,指模型即服务的模式)侧重模型调用与管理,ATaaS更聚焦企业级生产场景中的推理效能交付,帮助企业获得可规模化、可运营的高品质Token生产能力。
在模型策略上,该团队坚持“少模型、深优化”的路线,不追求泛泛地支持上百种模型,而是聚焦少数高生产力模型,围绕企业真实场景持续优化输出质量、推理效率、TTFT(Time To First Token,指首Token延迟)稳定性和 TPS(Tokens Per Second,每秒Token数)表现。“对企业而言,模型数量并不直接等同于生产力,真正关键的是每一次调用能否稳定支撑业务结果。”趋境科技相关负责人说。
目前,趋境科技已通过ATaaS平台为智谱 GLM、月之暗面 Kimi 等多个企业级客户提供服务,平台日均处理Token量近万亿。经过高复杂度、高并发业务场景的长期验证,公司已形成面向规模化推理交付的核心能力。
据悉,趋境科技背靠清华大学高性能计算研究所二十余年技术积累,已完成清华大学相关技术成果作价增资入股流程。该批技术成果由郑纬民院士、武永卫教授、章明星副教授等科研团队长期研发形成,覆盖高性能计算、并行与分布式系统、存储系统、智能算力系统和大模型推理基础设施等关键方向。相关成果的注入,标志着公司与清华科研团队在AI基础设施领域的产学研协同进入实质落地阶段。
本轮融资完成后,其将继续加大对高效能人工智能 Token 生产服务平台(Approaching AI Token as a Service,简称ATaaS)的投入,重点推进算力储备及底层推理系统建设,持续交付兼具低时延、高吞吐、稳定结构化输出、可靠函数调用和可预测服务质量的模型输出能力,进一步增强面向企业生产环境的高品质 Token 规模化供给能力。







快报
根据《网络安全法》实名制要求,请绑定手机号后发表评论