RAG 架构+向量数据库,高效构建企业级智能知识库应用 | 创新场景

创新场景
为了打通西门子中国内部的知识孤岛,运用生成式 AI 推进组织数字化转型,西门子携手亚马逊云科技在3个月内轻松构建了基于 Amazon SageMaker、Amazon EKS、Amazon RDS、Amazon S3、Amazon OpenSearch Service 等产品开发的智能对话机器人“小禹”,为企业内部提供了更优秀的产品功能与体验,在生成式 AI 领域迈出可喜的一步。

场景描述

运用新兴科技更好地发掘数据价值,是西门子中国持续发力的方向。西门子中国大禹团队应用大数据技术、机器学习、云技术、低代码来组建数据分析系统,专注于创新领域,借助 AI 能力更好地发挥数据的价值。

在构建知识库的过程中,大禹团队通过调研认识到,长期以来企业内部资源的检索和调用都存在结构散乱、检索速度慢、交互不便等问题。由于横跨多个不同领域、涉及多个不同业务单元,如若以传统方式打造知识库,这些问题将一直是横亘在部门间的长久之痛。因此,大禹团队决定将大数据库和生成式 AI 应用于一个全新的“智能知识库”,从根本上提升知识库的可用性。

解决方案

由于公司体量庞大,智能数据库的构建需面向多个不同业务部门,势必涉及大量的业务数据和文本数据。因此,智能知识库的存储架构,成为亚马逊云科技为西门子设计智能知识库时的首要考虑。

智能知识库的架构设计,实质上是大语言模型(LLM,Large Language Model)在知识检索领域如何得到充分利用的问题。亚马逊云科技决定采取检索增强生成(RAG,Retrieval Augment Generation)方式增强模型,使之具有来自存档知识源的增强上下文的模型架构。

最终亚马逊云科技为大禹团队提供的,是一个智能知识库暨智能会话机器人的解决方案指南,其中包括预训练大语言模型,Amazon OpenSearch Service 的向量数据服务,以及相关系统集成等。该解决方案指南具备自然语言处理能力、知识库检索能力、甚至是以数据去训练大语言模型的能力,这些核心关键能力让解决方案指南能实现目标知识库约 80% 功能,西门子中国根据企业内部需求再做 20% 定制化开发,最终形成完整的解决方案。

其中,最大的亮点在于“RAG 架构+向量数据库”设计:

•核心主体知识库以向量方式构建,能够存储超大规模的向量数据。通过对数据进行向量嵌入处理,跨部门、跨业务、跨场景的数据之间也能够进行关系考量。而 Amazon OpenSearch Service 的 k 近邻(kNN)插件为它提供了核心向量数据库功能,现在向量嵌入可以与单个混合请求中基于文本的关键字组合,查询时在几毫秒内就可获得数十亿向量的上下文相关响应。

•另一方面,RAG 架构极大地拓展了大模型的可用性。普通情况下当知识库新增内容时,相应的大模型必须进行微调,甚至是重新训练。而 RAG 允许对新增部分使用相同的模型处理,无需调整模型。这就相当于知识库在不影响访问速度的前提下,拥有了近乎无限的可扩展性。由向量数据库保障的杰出性能,再加上 RAG 架构提供的无限潜力,这就是智能会话机器人“小禹”能够在用户以简单语言进行提问的前提下,快速反馈生成式回答的秘密。

Amazon SageMaker 也为架构的伸缩性以及大语言模型持续迭代提供了很大帮助。借助 SageMaker Endpoint 的弹性伸缩能力,系统可以自动按照负载调整用于实时推理的资源,保证访问需求的同时提升整体性价比。Amazon SageMaker 上提供了丰富的模型开发和训练工具,保证客户可以在云端轻松实现大语言模型的调优以及测试更多不同类型的开源模型。

成效

相对于传统机器人,“小禹”智能会话机器人的回答内容不仅生成速度更快,其对搜索关键词的命中率也更高,整体使用体验远超传统机器人。西门子中国专属智能知识库上线后,首周就有超过 4000 位内部用户参与使用,超过 12000 个问题被提出并解答。作为智能知识库,它不但解决了各业务部门之间需求相似、重复开发的问题,更以云上弹性资源和托管的 Amazon OpenSearch Service 、Amazon SageMaker 等服务节约了系统在运维和扩展方面的投入成本。

本文系作者 亚马逊云科技 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 知识库构建不性感,但可能是大企业开始大规模应用AI的最可行、也见效最快的场景

    回复 2024.09.06 · via miniapp_iphone
  • 数据架构和治理是实现数字化和智能化的基础

    回复 2024.09.04 · via miniapp_android

快报

更多

2026-04-20 23:10

伊朗媒体:伊朗不参加谈判的决定尚未改变

2026-04-20 23:09

国内商品期货夜盘收盘,焦炭、焦煤均涨超1%

2026-04-20 23:00

航天电器:有算力领域液冷连接器等产品,并为下游客户配套

2026-04-20 23:00

以色列:将同黎方代表在美进行第二轮谈判

2026-04-20 22:58

伊叙边境拉比亚口岸时隔13年重新开放

2026-04-20 22:57

江苏国信:2025年度净利润34.65亿元,同比增长7.01%

2026-04-20 22:57

明泰铝业:2025年度净利润19.60亿元,同比增长12.10%

2026-04-20 22:56

印尼计划自7月起停止进口柴油

2026-04-20 22:56

QXO拟以170亿美元收购TopBuild,TopBuild大涨逾16%,QXO跌超8%

2026-04-20 22:46

中国企业能拿到美国关税退款吗?专家分析:两类中企或能拿到美国关税退款

2026-04-20 22:45

美军方:封锁开始以来,已有27艘船只掉头或返回伊朗

2026-04-20 22:43

中恒电气:2025年度净利润1.26亿元,同比增长15.27%

2026-04-20 22:42

传化智联:2025年度净利润同比增长282.12%

2026-04-20 22:42

凤凰传媒:2025年度净利润17.95亿元,同比增长12.37%

2026-04-20 22:41

特朗普称并非因以色列才对伊朗开战,他威胁停火到期将开炸

2026-04-20 22:29

巴基斯坦外长:美伊双方应尽早持续开展对话和接触

2026-04-20 22:28

美关税退款系统上线,数千家企业已提交申请

2026-04-20 22:27

应急管理部:强化高层建筑等人员密集场所火灾隐患排查

2026-04-20 22:25

捷途旅行者PLUS双车预售,价格18.99万起

2026-04-20 22:21

景顺长城基金去年净利增44%,长城基金增19%

2

扫描下载App