谷歌发布首个原生多模态嵌入模型Gemini Embedding 2

钛媒体App 3月11日消息,谷歌周二发布其首个原生多模态嵌入模型Gemini Embedding 2,将文本、图像、视频、音频及文档统一映射至单一嵌入空间,彻底实现跨模态检索与分类,支持超过100种语言。相比仅处理文本的前代,新模型支持最多8192个文本输入token,图像单次最多6张,视频最长120秒,音频无需转录,PDF限6页。模型已通过Gemini API和Vertex AI开放预览,适用于RAG、语义搜索、情感分析等场景。(广角观察)

本文内容仅供参考,不构成投资建议,请谨慎对待。

评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
投资日历
更多