2026年6月10日,苹果在年度全球开发者大会(WWDC)上正式发布CoreAI引擎,它将接替已使用九年的CoreML框架,成为苹果生态系统中端侧人工智能模型推理的核心技术支撑。CoreML自2017年推出以来,为iPhone、Mac等设备提供了本地AI推理能力,但随着大语言模型(LLM)向端侧迁移的趋势加快,原框架在模型内存支持、推理速度及温控稳定性等方面逐渐难以满足需求,CoreAI的推出正是苹果应对这一行业趋势的关键布局。
CoreAI引擎专为端侧大模型推理优化,核心优势在于支持更大的模型内存容量和灵活的模型格式,能适配从中小参数到较大参数LLM的运行需求。测试数据显示,在M4系列Mac设备上,CoreAI运行Qwen3 0.6B小模型时,推理速度较苹果此前推出的MLX框架提升2.47倍;不过当模型参数提升到8B时,速度优势收窄至5%,这一结果也体现出大模型参数规模对端侧硬件资源的消耗压力。该引擎重点针对iPhone 17 Pro及M4系列设备优化,旨在提升这些高端设备上本地LLM的解码速度,让用户无需依赖云端就能获得更流畅的AI交互体验。
CoreAI的技术核心是采用Apple Neural Engine(ANE)与GPU协同的推理方案,这一方案在持续负载下表现出更优的温控稳定性。相比纯GPU的推理路径,ANE协同方案能更高效地分配计算资源,降低设备长时间运行时的发热情况,这对iPhone 17 Pro这类移动设备尤为重要,可确保AI应用在持续使用中保持性能稳定,不影响用户体验。此外,CoreAI对模型格式的灵活支持,让开发者能更便捷地将不同架构的LLM适配到苹果设备上,降低了端侧AI应用的开发门槛。
CoreAI的推出带来了多方面的价值:对用户而言,本地推理意味着数据无需上传云端,有效保护了隐私;对开发者来说,更高效的推理框架将推动更多AI应用在苹果生态内落地,尤其是语音助手、智能翻译等需要实时响应的场景;在行业层面,苹果这一举措进一步巩固了其在端侧AI领域的领先地位,也将加速整个行业对端侧大模型推理技术的投入与创新。
行业近期数据显示,2026年第一季度全球端侧AI芯片市场规模同比增长32%(数据来源:IDC),端侧AI已成为科技巨头竞争的核心赛道。在竞争对手方面,谷歌近期更新了TensorFlow Lite框架,优化了Android设备上大模型的本地推理性能,支持参数规模达10B的模型运行;高通则在骁龙8 Gen4芯片中集成了增强型AI引擎,声称端侧推理速度较上一代提升40%,并支持更多开源LLM的适配。这些动向都说明,端侧大模型推理技术正进入快速迭代期,苹果CoreAI引擎的推出将进一步加剧该领域的竞争。






快报