商汤日日新大模型体系更迭升级，金融、医疗等行业场景落地已超20个

钛媒体App了解到，截至今年5月，基于商汤大装置SenseCore和日日新大模型体系，商汤已获得超过10个大模型客户、超过40个KA（核心关键）客户，超过5个前沿领域覆盖，超过20个行业场景落地。

今年6月拍摄的商汤大模型产品商量SenseChat界面（来源：钛媒体App编辑拍摄）

时隔仅3个月，商汤“日日新”AI大模型正式更新，部分能力超越了基于GPT-3.5的ChatGPT，并且这家AI巨兽开始把重心放到大模型规模化落地应用中。

钛媒体App获悉，在2023世界人工智能大会（WAIC）上，商汤科技董事长兼CEO徐立宣布，“商汤日日新SenseNova”大模型体系进行了多方位全面升级，以及公布在该体系下的一系列大模型产品更新和落地成果、应用实践等。

其中包括，商汤更新千亿级参数自然语言处理模型“商量”2.0版本，支持阿拉伯语和粤语，并推出小模型商量S版（SenseChat S）等不同参数量级的模型版本，可适配移动端等不同终端及场景的应用需求；全新秒画3.0则将参数量提升至70亿量级；如影2.0将语音和口型流畅度提升30%以上；琼宇2.0空间重建效率提升20%，渲染性能提升50%；格物2.0对物品纹理及材质的渲染精细度达到毫米级。

据悉，今年3月商汤科技发布的2022财年报中，公司愿景和战略目标从“以人工智能实现物理世界和数字世界的连接，促进社会生产力可持续发展，并为人们带来更好的虚实结合生活体验”，转型为“将通用人工智能（AGI）作为核心战略目标，以期在未来几年内实现AGI技术的重大突破”。

基于此变革，商汤科技建立并执行AI for All的发展目标，将重点放到以SenseCore Al大装置作为大模型生产的核心平台，以及以商汤AIDC人工智能计算中心平台作为大算力AI基础设施能力，从而打造通用能力的多模态大模型，而且进一步做垂直领域的行业、更具专长的专业大模型，从根本上降低大模型的下游应用成本和门槛，确保AI技术的发展惠及全人类。

商汤2022财年财报会议公布新的发展目标

今年4月10日，商汤正式首次公布“日日新SenseNova”大模型体系，以及自研的中文语言大模型应用平台“商量”，参数量达千亿，可实现文本生成、图像生成、多模态内容生成等能力与场景应用。同时商汤科技还与上海 AI 实验室研发了多模态、多任务通用大模型“书生”。（详见钛媒体App前文：《商汤版ChatGPT来袭，中国激战千亿“大模型”》）

本届WAIC上，商汤更迭日日新SenseNova大模型体系以及一系列大模型、数字人、文生图产品应用，在整个性能、数据准确度和精度等方面均有提升。

“日日新”大模型体系下，自然语言处理模型“商量”2.0版本突破了大语言模型输入长度的限制，推出不同参数量级的模型版本，可适配移动端、云端等不同终端及场景的应用需求，降低部署成本。
文生图生成式AI模型“秒画”3.0的模型参数从今年4月首次发布以来的10亿提升至70亿量级，实现专业摄影级的图片细节刻画。
数字人生成平台“如影”2.0相较1.0版本的语音和口型流畅度提升30%以上，实现4K高清视频效果，具备AIGC生成形象及数字人歌唱功能，可应用于线上短视频、直播平台。商汤将与多个头部企业共建“云+AIGC+短视频直播”生态，带来高效低成本的AI视频和营销工具。
3D内容生成平台“琼宇”2.0（场景生成）的空间重建效率提升20%，渲染性能提升50%，1200TFLOPS/秒算力支持下，每100平方公里场景的建图时间仅38小时即可完成。

对于商汤大模型商量2.0，徐立透露，其AI代码助手性能全面提升，推理效率提升619%，HumanEval测试集一次通过率达48.7%，超过GPT-3.5的48.1%。而且，无需训练模型，就可以快速融合知识生成，搭配企业知识库可以快速解决相关领域问题。此外，“针对前端、终端的应用需求，我们推出了小模型，小模型不但性能上有一定突破，在前端的运行上也能够跑到高通骁龙8 Gen2的终端芯片上，使得我们更多的终端应用变得可能。”徐立表示。

算力方面，目前商汤在上海临港AIDC已经有接近3万块的GPU（图形处理器），目前算力已达到5000 PetaFLOPS（1 PetaFLOPS等于每秒1千万亿次浮点运算），能够支持更多千亿规模的大模型算力训练。同时，商汤现已支撑10家以上的单位机构在临港的智能计算中心中去训练他们的大模型。

另外，商汤还现场展示基于日日新SenseNova大模型体系的产业升级和应用落地。

在金融领域，商汤与银行、保险、券商等客户展开合作，利用数字人进行智能客服、智慧营销等工作，并通过接入大语言模型能力，提供投研分析、研报撰写等新功能，实现降本增效；
在医疗场景，商汤基于医学知识和临床数据开发了中文医疗语言大模型“大医”，提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力，未来将支持医学图像、文本、结构化数据等多模态综合分析。
面向线下场景，商汤通过大模型能力为电网巡检带来长尾故障识别、复杂缺陷判断等智能解决方案；
基于琼宇2.0的空间重建，商汤为济南马山镇区域开发、合肥中国视界园区、上海瑞金医院等打造实景空间的数字孪生，提升运营管理效率；
在珠宝行业，依托格物2.0商汤为珠宝品牌进行珠宝首饰复刻，细致展现商品工艺特点，提升顾客购物体验。

此外，在智能汽车的智能座舱方面，商汤致力于建立“车舱大脑”。基于感知决策一体化的自动驾驶通用大模型UniAD，商汤构建车路云协同的交通体系，凭借多模态多任务通用大模型开发路侧视觉感知大模型，结合“琼宇”2.0及“格物”2.0构建智能交通孪生与仿真，并利用“商量”2.0的感知推理和人机交互能力，推动车路云共同向大模型对话式交互演进。

据徐立透露，商汤自动驾驶通用大模型UniAD在多目标追踪准确率上实现了20%以上的提升，车道线准确率超过30%，运动预测误差降低40%，规划误差降低了30%。据商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚透露，目前该模型正在面向量产，UniAD框架测试下整个智能驾驶有比较显著的提升。

钛媒体App了解到，截至今年5月，基于商汤大装置SenseCore和日日新大模型体系，商汤已获得超过10个大模型客户，超过40个KA（核心关键）客户，超过5个前沿领域覆盖，超过20个行业场景落地。

财报显示，2022财年，商汤科技营收为38.09亿元人民币，其中数字人、AIGC等智慧生活业务板块营收9.55亿元，同比增长129.9%，加上智能汽车业务收入占比为总营收的33%。

商汤CFO王征在年报会议上提到，预计到2025年，商汤两个“火箭”业务（生活和汽车）总占比将高达50%-60%左右。（本文首发钛媒体App，作者｜林志佳）

发表评论

0 / 300

根据《网络安全法》实名制要求，请绑定手机号后发表评论

请登录后输入评论内容

安东也很忙
中国这个企业真的能笑死人！用人家的大模型包装一下在上面训点数据就是自己的大模型了，真棒👏🏻
回复 2023.07.12 · via iphone
姜子牙垂钓互联网
A.在信息的世界里，信息资源、信息处理/加工工具、信息关系这三者应该是三位一体、同等重要的关系。 B.在当下的信息世界里，最短的板是--- 信息关系：关于信息关系的发现、建立、保持、管理和提升。 C.通用人工智能更主要地是“超级信息处理/加工工具”，它的出现将更加凸显“信息关系”的重要性和当下发展的不足。 [咖啡][握手]
回复 2023.07.11 · via iphone

商汤日日新大模型体系更迭升级，金融、医疗等行业场景落地已超20个｜WAIC 2023

敬原创，有钛度，得赞赏