DeepSeek内测“识图模式”,多模态能力正式开放|独家

钛媒体App 4月29日消息,部分用户反馈,DeepSeek网页版已上线“识图模式”。试用发现,该模式支持用户上传图片并进行内容理解与分析。目前,该功能尚未全量推送,具体功能边界尚不清楚。值得一提的是,就在今日,DeepSeek负责多模态开发的研究员陈小康在X平台发文“Now, we see you”并配图,图中DeepSeek标志性的鲸鱼“摘下”了眼罩。 本月初,DeepSeek刚刚上线了“快速模式”和“专家模式”,前者适合日常对话,即时响应;后者擅长复杂问题,高峰需等待。彼时就有网传截图显示,除了“快速”和“专家”模式,DeepSeek还有个名为“vision”的模式。最新的“识图模式”与前述“vision”入口高度吻合。分析认为,这标志着DeepSeek多模态能力的开放,其产品矩阵从纯文本对话正式延伸至图文交互,向GPT-4o、Gemini等主流多模态大模型靠拢。(广角观察)

本文内容仅供参考,不构成投资建议,请谨慎对待。

评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
投资日历
更多