2024CTIS-文章详情页顶部

“通义听悟”上线音视频问答助手,面向高校师生免费赠送500小时 | 钛快讯

“小悟”上线,在业界首次实现单记录、跨记录、多语言自由问。

钛媒体App3月19日消息,阿里大模型产品“通义听悟”发布多项新功能。其中音视频问答助手“小悟”上线,在业界首次实现单记录、跨记录、多语言自由问,支持对单个最长6小时、一次性上百条音视频的内容理解问答,用户可对超长音视频随心提问,让AI 总结任意知识点。

音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,长期以来内容查找难、回顾难、提炼难。

小悟通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。

针对用户需求,通义听悟还上线了一键AI改写、思维导图生成等新能力。例如,一键AI改写,将口语转为书面表达,尤其适合整理采访速记;思维导图自动生成,最多支持五级xmind脑图,适合播客摘要;笔记支持一键插入视频时间戳及截图、音视频文件语种自动识别等。

此外,针对学习科研场景对AI工具的强烈需求,通义听悟推出“高校公益计划”,通义听悟推出“高校公益计划”,推动AI算力普惠。所有中国大陆高校师生通过后缀edu.cn的教育邮箱进行认证后,均可直接获赠500小时转写时长,存储空间从20G拓展至200G。

据了解,作为国内首个开放公测的大模型产品,去年6月发布以来,通义听悟累计已有上百万用户,活跃用户日均转写音视频3次以上,平台每天处理字符数约20亿字。

(本文首发钛媒体APP 作者|张帅,欢迎添加作者mr3right爆料、交流)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App