2024CTIS-文章详情页顶部

钛媒体独家|人民网打造Sora场景的全球最大中文语义语料库?相关人员回应:这是我们新的业务方向

截至发稿前,人民网股价涨停,最新报25.64元/股。

Sora影片场景(来源:OpenAI)

Sora影片场景(来源:OpenAI)

钛媒体App获悉,2月20日下午,人民网旗下数据管理平台“人民数据”发布《人民数据打造全球最大中文语义语料库助力Sora新场景》,声称已打造近3亿条数据的新闻、问答等语义语料库。

这则消息引发市场广泛关注。随后,人民网(603000.SH)股价涨停,涨幅达10%,最新报25.64元/股。

2月20日下午,钛媒体App方面通过电话向有关负责人询问更多信息。人民网一位与该事件有关的消息人士向钛媒体App独家回应称:“对(文章属实)。这应该是我们在新的一年(2024年)业务主打的一些亮点与方向。”

官网显示,人民数据管理有限公司系人民日报、人民网旗下的平台,公司致力于构建全方位的大数据运营生态系统,使大数据更加便捷、高效地服务于经济社会发展,为各行各业广泛应用。作为新时代大数据领域中的 “国家队”, 人民数据管理有限公司以承建国家大数据灾备中心、国家应急数据中心、智慧党建数据中心等国家大数据项目为契机,打造安全、高效、开放、共享的国家级大数据平台,并致力于做好各级党政机关、央国企、民企等大数据的 “存、管、用” 工作。

2月16日,美国OpenAI公司宣布推出全新的生成式人工智能模型“Sora”。通过文本指令,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色,引发全球关注。

OpenAI表示,Sora是能够理解和模拟现实世界的模型的基础,这一能力将是实现AGI(通用人工智能)的重要里程碑。

人民数据在文章中表示,这是全球最大、助力Sora场景的中文语义语料库。

文章中透露,该语义语料库面向人工智能大模型、通用人工智能、智能互联网等应用场景。针对当前大模型普遍回答不了、回答不好却又必须直面、不容回避的重大问题、敏感问题、疑难问题、复杂问题,梳理了1万余个重点问题。语料库的进一步丰富充实或将使资料查找更加便捷,进一步降低了普通人的AI使用门槛,帮助普通人以更简单的方式获取更全面的信息。

但人民数据方面没有透露该语义语料库的更多中文名称以及细节等。

人民数据方面也提醒,AI 技术和应用创新,“合规”始终是底线。未来还需加强对AI大模型安全、规范、可持续发展的探索,充分挖掘各类数据资源价值,以构建主流价值语料库为抓手,推动中国AI产业安全发展。

(本文首发钛媒体App,作者|林志佳)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 蹭热度吗

    回复 2月23日 · via pc
  • A. 如果说现实的世界是以原子为基本形态而存在,那么,信息的世界就是以语言为基本形态而存在; B. 在现实世界里,人们追求对原子的“掌握”,相类比,在信息世界里, 人们所追求的就是对语言的把握。 C. 大语言模型首次成功实现了对语言的“机器化”把握。 D. 语言是信息世界的基本原子组成,至于语音、图形、视频等,就是信息世界里的分子、单体和聚合物了 ……。如果掌握了原子,那么其它层面就如高屋建瓴般了 [咖啡][握手]

    回复 2月21日 · via iphone
2

扫描下载App