对话阶跃星辰CEO姜大昕:两年发布16款多模态模型,DeepSeek证明投流模式不成立|钛媒体AGI

AGI
姜大昕表示,在阶跃星辰看来,最终的目标是做“世界模型”——这时候就达到AGI。

阶跃星辰创始人、CEO姜大昕

阶跃星辰CEO姜大昕

5月8日消息,钛媒体AGI获悉,阶跃星辰今天下午在北京举行一场媒体沟通会。

阶跃星辰创始人、CEO姜大昕向钛媒体AGI等透露,预计未来两、三个月(7-8月),阶跃星辰会发布满血版推理模型Step R1。同时,未来几个月,阶跃星辰还将发布更先进的Step图片编辑模型。

姜大昕强调,模型的突破是早于商业化的。“多模理解生成一体化”是当前阶跃星辰建立世界模型的最佳路径之一,从而往智能涌现、AI Agent和通用人工智能(AGI)方向发展。

谈及C端投流话题,姜大昕对钛媒体AGI表示,DeepSeek出来之后已经证明,投流逻辑是不成立的,大家还是需要重新思考这个问题。

“DeepSeek给我们的经验或是学到的东西,投流的逻辑实际上是不成立的,因为ChatGPT没有去说过,但是他如果放开流量的话,他破亿是没有问题的。其实就是大家要重新思考一下,AI时代的产品,它的流量增长是不是真的是像传统互联网状态,还是靠投入上去的,大家需要重新看待这个问题。不只是DeepSeek,像哪吒、黑悟空神话等都有一些共性,不是靠传统的铺天盖地的去投入、去积累。”姜大昕称。

姜大昕表示,AI Agent智能体爆发的前提需要多模态和慢思考能力,恰好2024年这两个能力获得了突破性进展。“多模态对于Agent的输出是一个必备功能。”

姜大昕表示,模型的“理解生成一体化”非常重要,它是整个计算机视觉需要突破的一个堡垒。所谓GPT-4时刻,就是指模态层面AI模型真正能够达到人的智能水平。因此,在阶跃星辰看来,最终的目标是做“世界模型”。

“为什么大家觉得AGI路线越来越清晰,我确实有同样的感觉,文本这条路已经看到了这里(当前)。虽然视觉最根本的问题当下没有解决,但一旦突破以后,今后的道路会更加顺畅。”姜大昕称。

阶跃星辰成立于2023年4月,是行业领先的通用大模型创业公司,坚定探索实现通用人工智能(AGI)的道路,已对外发布Step系列基座大模型矩阵。

阶跃星辰以“智能阶跃,十倍每一个人的可能”为使命,坚定自研超级模型,积极布局算力、数据等关键资源,发挥算法和人才优势,微软前全球副总裁姜大昕担任公司创始人、CEO,ResNet作者之一的AI科学家张祥雨、拥有丰富大规模集群与系统建设经验的AI系统专家朱亦博等都先后加入阶跃星辰。

融资方面,2024年12月,阶跃星辰宣布完成B轮融资,总融资金额达数亿美元,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。

产品层面,成立两年,阶跃星辰已经累计发布了22款自研基座模型,覆盖文字、语音、图像、视频、音乐、推理等全系列。

其中,16款是多模态模型,占比超过7成,在行业内被称为“多模态卷王”。多模态模型矩阵覆盖图像理解、视频理解、图像生成、视频生成、图像编辑、音乐生成等,全部处于行业领先水平。

产业应用层面,阶跃星辰聚焦智能终端Agent,已在汽车、手机、具身智能、IoT等关键应用场景与行业头部达成深度合作。

今年1月,阶跃星辰发布了Step R-mini,成为Step系列的首款推理模型,进一步拓展了大模型的能力边界;2月,阶跃星辰宣布开源新的文生视频/图生视频模型Step-Video-T2V/TI2V,并与吉利汽车集团、千里科技、OPPO、智元机器人、TCL等企业展开合作,以及发布全新升级的“繁星计划”2.0等。

进入5月,阶跃星辰宣布与ACE Studio联合开源3.5B版本的音乐大模型ACE-Step,并且与灿星文化战略合作,开展AI+娱乐的深度融合。

姜大昕表示,多模态是实现AGI的必经之路。

他进一步表示,因为首先AGI对标的是人类的智能,人的智能是多元化的,每个人除了有来自语言的符号智能,还包括视觉智能、空间智能、运动智能等,这些智能需要通过视觉和其他模态来学习。所以,在多模态领域任何一个方向出现短板,都会延续这个实现AGI进程。

姜大昕谈到三个AI技术方向(预测):

  • 1、预训练基础模型+强化学习,可以激发模型推理的时候产生长思维链,极大提高模型的推理能力,从而把长思维链能力加入到语言模型,以及多模态模型里面。
  • 2、视觉领域理解生成一体化。理解和生成是用一个模型来完成,从而保证生成内容有意义和价值,需要对上下文做更好的理解。
  • 3、有了ChatBot App应用产品以后,我们就可以用它解数学题、写代码,然后下一步进化现在就是非常火热的Agent,就是智能体。“我相信智能体终将从这个数字世界走向物理世界,逐渐引申到像智能驾驶、人形机器人等领域。”

姜大昕认为,目前汽车辅助驾驶VLA是简单预测模型,并没有推理的VLA。对应来说,人是脑海里有一个action的分布,通过对未来的预判来决定,才能呈现出真正的VLA。

智能终端Agent是阶跃星辰的发力领域。姜大昕称,Agent首先要能够更好去帮助人类去完成任务,需要理解用户所处的环境和任务情况,其实很多终端是用户感知、用户体验的延伸,比如说手机、AI眼镜或是AI耳机,被认为是人体器官延伸,它可以去收集我们所处的环境,从而能帮助模型更好地理解用户的上下文。

姜大昕称,他非常看好AI眼镜的发展,人形机器人的泛化能力还有很长的路要走。

谈及阶跃星辰依然坚持基础大模型,姜大昕认为有两层:一、现在AI技术的行业趋势和需求还是非常强烈的,整个行业技术发展很快,所以,公司需要这样一个前进趋势,从而坚持做基础模型研发;二、从应用角度看,我们一直觉得应用和模型是相辅相成的,模型可以决定应用的上限,然后应用给模型提供具体的应用场景,它的数据,这是非常重要的。

谈到C端盈利空间,姜大昕称,阶跃星辰是通过端侧AI Agent服务提供,最终这些企业和终端还是服务于消费者。

谈及阶跃多模态在行业里定位时,姜大昕表示,海外层面,OpenAI和Google是第一梯队xAI的隐藏实力是很强的,需要时间爆发;国内的 AI 产品更强调理解领先性,或者专注在AI视频生成单一领域,而阶跃星辰不太一样的点在于,不仅做基础模型,还在代际层面做很多应用。

“最后总结一下,第一个,我们目前状态是坚持基础大模型研发,所以追求AGI是我们的初心,我们也不会改变;第二是在当前竞争格局当中,阶跃差异化的特点其实是多模态能力,在业界内性能是领先的,而且我们也在积极探索前沿方向,我们也认为还存在非常巨大的机会;最后在应用层面,我们也走了一条差异化路线,携手合作伙伴在智能终端AI Agent方向上发力,最终形成一个从模型到Agent,从云上到端侧的这样的生态体系。”姜大昕表示。

(本文首发钛媒体App,作者|林志佳)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 推理能力提升靠预训练+强化学习,这方法靠谱不?

    回复 5月9日 · via h5
  • 文生视频模型都开源,造福开发者,点赞!

    回复 5月9日 · via android
  • 7 - 8月发新模型,蹲一个,看看性能咋样!

    回复 5月9日 · via android
  • 说投流不行,那企业该咋推广AI产品?

    回复 5月9日 · via iphone
  • AI眼镜真能火起来,阶跃星辰要成先驱?

    回复 5月9日 · via android
  • 发布新模型,又要卷死同行了!

    回复 5月9日 · via android
  • 人形机器人任重道远,看来还得慢慢磨!

    回复 5月9日 · via h5
  • 汽车、手机都合作,阶跃星辰这是要全面渗透智能终端!

    回复 5月9日 · via android
  • 理解生成一体化,听着高大上,实际用起来啥效果?

    回复 5月9日 · via h5
  • 基础模型研发投入大,阶跃星辰能扛住吗?

    回复 5月9日 · via pc
更多评论

快报

更多

2025-05-19 23:05

国内期货夜盘收盘涨跌互现,棕榈油涨近1%

2025-05-19 22:54

比特币回升至104000美元

2025-05-19 22:50

百合股份:目前生产经营活动一切正常

2025-05-19 22:46

增持承诺“爽约”,公司退市后控股股东仍遭监管警示,海印股份回应

2025-05-19 22:39

消息人士:若特朗普政府批准交易,新日铁将向美国钢铁投资140亿美元

2025-05-19 22:38

越秀地产附属拟约41.49亿元出售北京海臻置业65%股权

2025-05-19 22:24

韵达股份:4月快递服务业务收入41.51亿元,同比增长5.84%

2025-05-19 22:23

纳思达:拟出售美国利盟100%股权,将集中资源发展打印机自主品牌

2025-05-19 22:17

习近平在河南洛阳市考察调研

2025-05-19 22:15

特朗普与泽连斯基通话

2025-05-19 22:09

美股低开高走,道指率先翻红

2025-05-19 22:07

美格智能:筹划发行H股股票并在香港联交所上市

2025-05-19 22:03

特朗普与普京进行电话会谈

2025-05-19 22:02

美国4月谘商会领先指标环比下降1%

2025-05-19 22:01

中国操作系统市场规模或达250亿元

2025-05-19 21:49

曝苹果目前每年从App Store赚200亿美元

2025-05-19 21:48

瑞银:国际资本对中国资产关注度升温,“A+H”进入新一轮上行周期

2025-05-19 21:45

商务部部长王文涛会见丹麦外交大臣拉斯穆森

2025-05-19 21:31

美股开盘:三大指数集体低开,纳指跌1.42%,特斯拉跌近4%

2025-05-19 21:29

慧博云通:拟引入长江产业投资集团作为战略投资者

44

扫描下载App