Skip to main content
21 min read

AI时代,企业的业务底座正在从数据库变成知识引擎

作者:卢向东,杭州萌嘉网络科技有限公司创始人。团队长期专注于企业 AI 落地与 AI 知识引擎实践,是国内较早探索 RAG 企业应用落地的团队之一。产品 TorchV 已成功服务浪潮信息、微众银行、物产中大、台州银行、适途汽车、中汇税务师事务所等客户。

很多企业这两年都在做AI,买了大模型,接了API,搭了开源的RAG系统,也做了几个Demo。但真正上线到业务里,很快就会遇到同一个问题:

系统并不是不会回答,而是总差那么一点意思。

同一个问题,旧制度里有答案,新通知里也有答案;产品手册有一个说法,售后案例又有另一个说法;总部文件说可以,区域规定说不行。这时候你会发现,企业AI真正缺的不是更聪明的模型或RAG,而是一个能让AI正确使用企业知识的底座

过去二三十年,企业信息化其实一直围绕一件事展开:

把业务装进数据库。

我相信不仅是我们这些软件从业者,也包括大部分企业的CIO、CTO和技术leader们,都在做的事情就是把采购、库存、生产、财务装进ERP的数据库表里,把客户、商机、合同、回款装进CRM的表里。其他的包括OA和BI也都是围绕着关系型数据库在做文章。当然,还有互联网和移动互联网,几乎也是把关系型数据库作为最核心的基础设施之一。

但到了AI时代,一个更根本的问题出现了:

企业最有价值的资产,真的还主要存在数据库里吗?

对于很多银行、制造企业、集团公司、能源企业、政企机构来说,答案正在越来越明显:不是。

数据库记录了订单、库存、金额、状态、时间等,它依然重要。但在AI时代真正决定业务判断的东西,已经不在数据库里了。

它们在哪里?

如果你已经是重度大模型用户,并且对CodeX、Claude Code、OpenClaw等Agent有一定的了解,你会知道我们不需要那些严格结构关系的数据,只需要制度文件、合同条款、产品手册、研发文档、售后案例、会议纪要、客户反馈和法规政策等就也可以让AI帮我们给出很好的建议,帮我们直接去完成业务操作。

这些东西,在过去常常被叫作“非结构化数据”。这个名字的潜台词就是:这些东西不规整,不好处理,不像数据库里的行和列那么舒服。

但AI时代来了以后,它们换了一个名字。它们叫:企业知识。

image-20260510234011307

这就是今天企业AI最重要的变化:

  • 在互联网时代,企业软件的核心对象是数据;
  • 在AI时代,企业智能化的核心对象变成了知识。

所以,互联网时代靠数据库,企业AI时代必须靠知识引擎。

一、关系型数据库为什么赢了上一代企业软件?

关系型数据库之所以重要,不是因为它听起来高级。

恰恰相反,它重要,是因为它解决了上一代企业最核心的问题:如何把业务准确记录下来。

比如一笔采购有没有发生?一批货有没有入库?一张发票有没有开出?等等。这些问题都要求确定性。

关系型数据库非常适合处理这种世界。

它擅长记录、查询、统计、关联、事务一致性。它让企业第一次可以大规模、低成本、稳定地把业务过程变成数字记录。

所以,上一代企业软件的本质,是把现实世界的经营活动,压缩成结构化数据。

这也是为什么ERP、CRM、OA、BI都离不开数据库。它们都站在数据库上。

这就是基础设施的特征:真正的基础设施,不是某一个应用,而是让很多应用都能长出来的土壤

关系型数据库支撑了企业信息化时代,但它支撑的是一个以“记录”为中心的时代。

今天,企业对AI的期待已经不是“帮我查一条记录”。企业想让AI做的是判断、解释、总结、推理、生成、执行。

这时候,光有数据库就不够了。

二、AI时代,企业真正要处理的不是数据,而是知识

我们看企业现在真正想让AI做什么:

  • 客户经理问:“这个客户能不能适用最新的信贷政策?”

  • 售后工程师问:“这台设备的故障,最可能是什么原因?以前有没有类似案例?”

  • 合规人员问:“这份合同里有没有违反公司制度或监管要求的条款?”

  • 管理者问:“过去几个项目失败的共性原因是什么?”

    这些问题,当然也需要数据。但更关键的不是数据,而是知识。因为答案往往不在一张表里。

    它可能散落在5份制度、3版通知、几十个案例、一堆会议纪要和某位专家的经验判断里。

    这就是AI时代和互联网时代最大的不同。

数据告诉你,一个客户逾期了几次。 知识告诉你,在什么情况下这类客户还能不能授信。

数据告诉你,某个零件换过三次。 知识告诉你,这可能不是零件问题,而是安装环境问题。

数据告诉你,某个流程已经审批完成。 知识告诉你,这个流程本身是否符合最新制度。

所以,企业AI最需要补的不是“会说话的模型”,而是“可使用的知识”。

有些企业以为自己已经有知识库了。但只要真正做一次AI落地,就会发现:

企业并不是没有知识。

企业的问题是:

知识很多,但不可用。 文档很多,但不可信。 系统很多,但不互通。 经验很多,但不可调用。

这才是企业AI的第一堵墙。

三、为什么向量数据库也不等于知识引擎?

过去两年,很多企业一做AI知识库,就会立刻想到RAG和向量数据库。这很正常。

RAG确实是大模型进入企业场景的关键技术路径,向量数据库也确实解决了语义检索的问题。

但有一个误区必须说清楚:

向量数据库是知识引擎的重要组件,但它不是知识引擎本身。

向量数据库主要解决一个问题:

“和这个问题语义相似的内容在哪里?“

但企业真正关心的问题更复杂:比如这段内容是不是最新?它是不是企业内部对这个问题最正确、最有价值的内容?这个内容是不是已经过期了?等等。

向量数据库本身回答不了这些问题。

一个很典型的场景是:

旧员工手册写得非常详细,新员工手册写得比较简略。 如果只看语义相似度,旧员工手册很可能更容易被召回。

所以,向量数据库解决的是“相似内容在哪里”。

而知识引擎解决的是:

企业AI应该相信什么、引用什么、在什么边界内使用什么

真正让企业AI跑起来的,是围绕知识全生命周期构建的知识引擎。

四、AI时代的知识库,已经不是“库”,而是“引擎”

“知识库”这个词,容易让人误解。很多人会把一些知名的开源RAG系统当作知识库,因为他们的认知还停留在把文档放进去,需要的时候搜一下。

但一些非常领先的企业已经在AI时代把库变成了引擎——它不是存储,而是驱动。AI时代的知识引擎像生产线,它是为业务而治理知识。

它要让知识持续进入、持续治理、持续调用、持续优化。

这至少包含四件事。

第一,知识构建。

image-20260510231935895

企业知识不能只是“上传文件”。

PDF、扫描件、Word、表格、会议纪要等,进入系统后,需要被解析、清洗、切分、标注、关联、结构化。还需要提取它的元数据来进一步描述这个文件的信息。

知识构建的本质,是把原本分散、混乱、不可计算的内容,变成AI可以理解和调用的知识资产。

另外还有就是自动化,知识引擎需要完成的是知识可以从企业内各个角落自动进入构建管道,然后被治理。

第二,知识治理。

image-20260510231242433

知识必须要标记依据是什么,谁发布的,什么时候生效,适用于谁,当前用户能不能看。

对银行、制造、能源、医药、集团型企业来说,这一点尤其重要。

因为企业场景里,很多错误不是“体验问题”,而是风险问题。

所以,知识治理要处理来源、作者、版本、生效时间、失效时间、权威等级、适用范围、部门权限、密级、审核状态。没有治理的知识库,越大越危险。

另外非常重要的就是知识的分类,从杂乱的文档,到符合知识生产的分类(如按部门、按产品线等分类),再到按面向知识消费者(业务部分、某个开发者或者某个贷款审批应用等)的分类。

第三,知识召回。

image-20260510231712822

企业AI回答得好不好,很大程度不取决于模型有多聪明,而取决于它回答前拿到了什么上下文。

很多AI项目失败后,第一反应是换模型。但真正的问题往往不是模型不行,而是喂给模型的上下文不对。

虽然现在很多人会说大模型的上下文窗口都已经那么大了,为什么还考虑这些。但是如果你真的是重度用户,相信应该不会说这样的话,因为一旦Agent在飞速奔跑,token的费用是非常高的,所以包括包括知识引擎、RAG等在内的Harness架构会非常认真地考虑这些,而不是一股脑把所有上下文都扔给大模型。

当然,好的知识引擎也不能只做向量检索,还需要做混合检索,以及现在正在越来越流行的Agentic检索——就是为企业知识建立知识地图,然后先通过大模型的意图判断找到需要涉及的知识域,再从知识域中寻找chunks等事实证据。这样才能更准确地召回知识。

第四,知识运营。

image-20260510231210755

这是最容易被忽视,也最决定长期效果的一环。

很多企业AI项目上线时效果不错,三个月后开始变差。不是模型突然变笨了,而是越来越多的知识进入,会引起知识之间的重复、过期、冲突等问题。这些问题哪怕是人都无法识别,何况AI系统并非真正的业务专家呢。

所以,知识库不能上线即结束,知识是必须被运营。

我们需要知识引擎的另外两个重要引擎:

  • 健康引擎
  • 优化引擎

它们的作用就是时刻在监测知识的问题,然后给出如何优化的方案。它们是企业AI能否持续可用的关键。

所以,知识引擎不是一个存储系统,而是一套知识生产系统。

五、为什么知识引擎会天然支撑Agent?

如果说过去的AI应用主要是问答,那么未来企业AI的主角一定会越来越多地变成Agent。

问答系统的目标是回答问题。 Agent的目标是完成任务

这两者完全不同。

  • 合同审查Agent,不只是回答“这个条款有没有风险”。它要理解公司合同模板、历史审查意见、风险规则、客户类型、审批权限,还可能要生成修改建议。

  • 售后Agent,不只是回答“设备怎么修”。它要理解产品手册、故障案例、备件库存、维修流程、客户服务等级,还可能要发起工单。

  • 合规Agent,不只是回答“制度怎么写”。它要理解监管要求、公司制度、历史审计意见、当前业务流程,还可能要判断某个操作是否违规。

这些Agent要真正进入企业业务,至少需要四个东西:

  • 正确知识。
  • 正确权限。
  • 正确上下文。
  • 正确工具。

所以,有一句话很重要:

Agent不是靠“聪明”在企业里上岗,而是靠知识、权限、上下文和工具在企业里上岗。

Demo可以靠模型能力和精心准备的提示词,真实业务不能。

真实业务需要稳定性、可追溯、可审计、权限控制、版本一致、异常处理和持续运营。

如果没有统一的知识引擎,每个Agent就会各自维护一套小知识库,那就是把大数据时代的数据孤岛在AI时代再重新上演一遍。真正的企业Agent体系,必须建立在统一的知识底座上。

这也是为什么像TorchV AIS这类企业级AI知识引擎产品开始变得重要,他们提供的不仅仅是一套软件,而是企业落地真正有效的解决方案。提供了包括Agent运行时需要的CLI原子命令,过程监控、证据链、知识和工具的授权等等。

image-20260510232613562

当企业里有越来越多Agent时,知识引擎就不再是某个应用的附属模块,而会变成所有Agent共同依赖的基础设施。

六、真正的企业AI竞争,不是模型之争,而是知识可用率之争

image-20260510234350232

我们可以看到,就国内来说,在大模型的采用上似乎大家是公平的,在线的大模型API,以及本地化的DeepSeek V4等,大家都是跟着时代一起在进步的。

真正拉开差距的,反而是企业自己的知识。

因为企业一定是围绕着自己的知识在开展工作的,包括市场销售、解决方案、产品研发和售后服务,都需要依赖于企业自身的知识。所以在AI时代,决定企业是否可以高效借助AI提升竞争力的关键差异是知识的治理和应用能力。我们在多家500强客户身上已经反复验证了这一观点。

这也是为什么企业级AI知识库会越来越重要。

它已经不是IT部门的文档管理工具,而是企业智能化的核心资产层。

结尾:AI时代,每家公司都要重建自己的“认知底座”

互联网时代,企业把业务搬进了软件。

AI时代,企业要把业务交给Agent。一个企业真正的竞争力,取决于你的知识力,取决于你在AI时代是否认真打造了新的“数据库”,是否真正拥有一个能让AI正确使用企业知识的引擎。

相关文章

大多数公司没有为AI做好准备,这里有一些方法论

企业是否已经为AI准备好了?7类问题自测;...