苹果CoreAI引擎取代CoreML：端侧大模型推理速度提升2.47倍，温控更稳定

2026.06.11 14:22

2026年6月10日苹果在WWDC发布CoreAI引擎，接替CoreML框架，专为端侧大模型推理优化。该引擎在M4 Mac上运行Qwen3 0.6B模型较MLX提速2.47倍，8B模型优势收窄至5%，ANE协同方案温控更优，重点提升iPhone17 Pro及M4设备本地LLM解码速度。

2026年6月10日，苹果在年度全球开发者大会（WWDC）上正式发布CoreAI引擎，它将接替已使用九年的CoreML框架，成为苹果生态系统中端侧人工智能模型推理的核心技术支撑。CoreML自2017年推出以来，为iPhone、Mac等设备提供了本地AI推理能力，但随着大语言模型（LLM）向端侧迁移的趋势加快，原框架在模型内存支持、推理速度及温控稳定性等方面逐渐难以满足需求，CoreAI的推出正是苹果应对这一行业趋势的关键布局。

CoreAI引擎专为端侧大模型推理优化，核心优势在于支持更大的模型内存容量和灵活的模型格式，能适配从中小参数到较大参数LLM的运行需求。测试数据显示，在M4系列Mac设备上，CoreAI运行Qwen3 0.6B小模型时，推理速度较苹果此前推出的MLX框架提升2.47倍；不过当模型参数提升到8B时，速度优势收窄至5%，这一结果也体现出大模型参数规模对端侧硬件资源的消耗压力。该引擎重点针对iPhone 17 Pro及M4系列设备优化，旨在提升这些高端设备上本地LLM的解码速度，让用户无需依赖云端就能获得更流畅的AI交互体验。

CoreAI的技术核心是采用Apple Neural Engine（ANE）与GPU协同的推理方案，这一方案在持续负载下表现出更优的温控稳定性。相比纯GPU的推理路径，ANE协同方案能更高效地分配计算资源，降低设备长时间运行时的发热情况，这对iPhone 17 Pro这类移动设备尤为重要，可确保AI应用在持续使用中保持性能稳定，不影响用户体验。此外，CoreAI对模型格式的灵活支持，让开发者能更便捷地将不同架构的LLM适配到苹果设备上，降低了端侧AI应用的开发门槛。

CoreAI的推出带来了多方面的价值：对用户而言，本地推理意味着数据无需上传云端，有效保护了隐私；对开发者来说，更高效的推理框架将推动更多AI应用在苹果生态内落地，尤其是语音助手、智能翻译等需要实时响应的场景；在行业层面，苹果这一举措进一步巩固了其在端侧AI领域的领先地位，也将加速整个行业对端侧大模型推理技术的投入与创新。

行业近期数据显示，2026年第一季度全球端侧AI芯片市场规模同比增长32%（数据来源：IDC），端侧AI已成为科技巨头竞争的核心赛道。在竞争对手方面，谷歌近期更新了TensorFlow Lite框架，优化了Android设备上大模型的本地推理性能，支持参数规模达10B的模型运行；高通则在骁龙8 Gen4芯片中集成了增强型AI引擎，声称端侧推理速度较上一代提升40%，并支持更多开源LLM的适配。这些动向都说明，端侧大模型推理技术正进入快速迭代期，苹果CoreAI引擎的推出将进一步加剧该领域的竞争。

作品声明：内容由AI生成