DeepSeek AI新模型:搭载 MODEL1 全新架构,最快2月上线
钛媒体App 1月21日消息,据报道,DeepSeek计划于今年2月中旬,推出新一代旗舰AI模型DeepSeek V4。该模型将搭载全新技术架构,写代码能力有望实现显著提升。根据DeepSeek官方GitHub仓库更新了一系列FlashMLA代码,借助AI对全部总代码文件数:114个(包括.py, .md, .txt, .sh, .cpp, .cu, .h文件)进行分析,发现了一个此前未公开的模型架构标识“MODEL1”,共被提及31次。FlashMLA是DeepSeek独创的、针对英伟达Hopper架构GPU深度优化的软件工具,专门加速大模型“推理生成”这一环节。MODEL1是DeepSeek FlashMLA中支持的两个主要模型架构之一,另一个是DeepSeek-V3.2。(广角观察)
本文内容仅供参考,不构成投资建议,请谨慎对待。
根据《网络安全法》实名制要求,请绑定手机号后发表评论