Skip to main content

TorchV AIS用户手册

第一部分:基础概念与系统介绍

第1章:TorchV AIS 知识引擎系统导览

1.1 什么是企业级知识引擎?

在当今数据驱动的商业环境中,企业内部积累了海量的非结构化数据,包括技术文档、市场报告、邮件、会议纪要、客户服务记录和内部规章制度。传统的企业搜索工具往往只能进行关键词匹配,难以理解查询背后的真实意图,导致信息检索效率低下,知识无法有效流转。企业级知识引擎的出现,旨在解决这一核心痛点。

它不仅仅是一个搜索引擎,更是一个能够理解、分析、并与企业内部知识进行智能交互的平台。TorchV AIS 企业级知识引擎系统正是为此而生。它旨在将企业分散、静态的数据资产,转化为一个动态、可交互的智能知识库。通过该系统,企业能够打破部门之间的信息孤岛,赋能员工快速获取精准信息,从而支持更明智的业务决策,并自动化处理知识密集型任务,极大地提升运营效率。其核心价值在于,让数据真正变得易于使用,从而释放员工的全部潜力。

1.2 核心概念:理解 RAG、LLM 与知识库

为了充分利用 TorchV AIS 系统的强大功能,理解其背后的核心技术概念至关重要。

  • LLM (大语言模型)

    大语言模型(Large Language Models)是人工智能领域的一项突破性技术。它们通过在海量文本数据上进行训练,学会了理解和生成人类语言。这使得它们能够执行摘要、翻译、问答和内容创作等多种任务。然而,通用的大语言模型缺乏特定领域的专业知识,并且其知识截止于训练数据的时间点,这可能导致它们在回答专业问题时出现信息过时或凭空捏造答案的情况。

  • RAG (检索增强生成)

    检索增强生成(Retrieval-Augmented Generation)是 TorchV AIS 系统的核心技术框架之一。它巧妙地将大语言模型的生成能力与企业内部知识库的精准检索能力结合起来。当用户提出问题时,RAG 系统首先会在企业专属的知识库中检索最相关的信息片段,然后将这些信息作为上下文,提供给大语言模型,并指示模型基于这些“有据可查”的内容来生成答案。这一机制是实现“幻觉控制”的关键,因为它将模型的回答严格限制在企业验证过的数据范围内,从而极大地提高了答案的准确性和可信度。从AI安全的角度来看,RAG技术将一个行为难以预测的AI系统,约束在一个可控且可靠的框架内,为企业应用提供了必要的安全保障。TorchV 平台底层的 torchv-unstructured 文档解析库经过专门优化,能够高效地为RAG应用提取和构建结构化内容,是实现这一目标的技术基石。

  • 知识库

    有时候也称为“知识仓库”。在 TorchV AIS 系统的语境中,知识库是一个经过精心组织和权限控制的文档集合。根据使用对象不同,又分为“团队知识库”和“个人知识库”,其中个人知识库仅用户本人,且每个用户只能创建一个“个人知识库”。使用知识库构成了特定AI应用(如客服机器人或销售助手)的“唯一事实来源”。企业可以根据不同的业务需求,创建多个独立的知识库,例如,一个用于人力资源部门,一个用于技术支持团队。通过这种方式,系统可以确保每个AI应用都只访问与其任务相关的数据,保证了信息的安全性和相关性。

  • 知识空间

    在TorchV AIS系统中,文档和数据的存储位置默认是知识库,方便用户对文档和数据进行编辑、解析设置和管理。而在知识使用过程中,系统也支持用户为专门的知识主题或知识应用创建自己的知识空间。如创建一个“年终奖计划”的知识空间,里面存放着:

    • 引用自总裁办公室知识库的年终奖计算规则和解释权方面的文档知识;
    • 引用自业务部门的全年度、半年度的业绩计算规则文档;
    • 引用自HR知识库的考勤、员工奖金制度等文档。

    知识空间功能目前暂未在TorchV AIS系统中开放。

1.3 TorchV 生态系统:关键组件与工作流程

TorchV AIS 系统提供了一个端到端的解决方案,其工作流程清晰、高效,涵盖了从数据处理到用户交互的全过程。

以下是系统的核心工作流程图示及说明:

  1. 数据注入 (Data Ingestion):用户通过界面或API将各类文档上传至系统。
  2. 解析与索引 (Parsing & Indexing):系统内置的 torchv-unstructured 引擎自动解析上传的文档,提取文本、表格和元数据,并将其转化为可供检索的格式。
  3. 知识库创建 (Knowledge Base Creation):管理员将索引后的数据组织成一个或多个逻辑独立的知识库,并可根据使用需要对分片(Chunks)进行重新配置。
  4. 应用创建 (Application Layer):用户通过无代码的机器人(ChatBot)构建器或可借助AI撰写的富文本编辑器(Assistant),创建面向最终用户的AI应用。同时也提供相应的API结果,用户可直接与其外部应用对接,或与Dify等流程编排工具对接。
  5. 用户交互 (User Interaction):最终用户通过对话界面或其他应用程序与AI进行交互,提出问题并获得基于知识库的回答。
  6. 分析与反馈 (Analytics & Feedback):系统会记录所有交互数据,管理员可以通过分析仪表盘洞察用户需求,并通过用户反馈持续优化知识库和AI应用的表现。

这一完整的工作流程,完美对应了TorchV平台的核心功能模块:知识库管理丰富格式支持应用创建配置管理洞察与推荐以及运营与反馈,为用户构建了一个从数据到价值的闭环体系。

第2章:快速入门:首次登录与仪表盘概览

2.1 访问系统

首次使用 TorchV AIS 系统,请通过您的组织提供的专属URL(https://ais.prod.torchv.com/) 访问登录页面。输入您的用户名和密码,或使用钉钉扫码登录。如果是首次登录,系统可能会要求您设置新密码。请遵循屏幕上的指引完成初始设置。

用户登录后8小时未进行任何操作,Session将被清除,需要用户重新登录。

image-20250821173702869

图:TorchV AIS登录界面。

2.2 系统首页

image-20250821230423308

图:系统首页

成功登录后,您将进入系统的首页。默认情况下,系统首页是门户形式的,当然我们也可以通过管理后台进行调整,调整成以AI问答为主的样式。以下是主界面各核心区域的功能说明:

  • 顶部功能栏:目前展示用户名称和问好信息,如果是以admin身份登录,该栏右侧显示“设置”按钮,管理员可对首页进行可视化的拖拉拽设计管理。
  • 主导航菜单(左侧)
    • 首页:知识门户和快捷入口,以及热门文档和知识动态等板块。
    • 知识库:创建、配置和管理您所有的知识库,这是知识管理的入口。
    • 应用中心:设计、构建和部署基于知识库的对话机器人或其他AI应用。
    • 知识加工:添加、删除用户,并分配不同的角色和权限(仅管理员可见)。
    • 监测中心:查看大模型使用情况、系统使用情况、用户查询分析和AI应用性能指标。
    • 管理中心:包括系统管理(模型管理、知识库配置、全局设置、系统日志等)、账号权限(角色管理、组织管理、团队管理、人员管理等)、内容与工具(标签管理、提示词、文档模板、下载中心等)和开放平台(账号安全、三方平台、开放密钥)。
  • 工作台:用户可自定义的个人首页,显示当前选定模块的详细内容和操作界面。可添加“推荐知识库”和“快捷入口”等内容。
  • 用户中心(左下角):点击您的头像,可以访问个人设置、系统通知、修改密码、反馈或安全退出系统。

建议您花几分钟时间熟悉这些导航元素,它们将是您日常操作的基础。

2.3 理解您的工作台与系统通知

TorchV AIS 系统支持多用户协作,并提供了清晰的通知机制,以确保您能及时了解系统状态。

  • 工作台:如果您是知识库维护者,可以尽早打造自己的工作台,把常用的知识库和常用的文档、应用等做成快捷入口,方便您的日常操作。
  • 系统通知:系统会通过左下角的用户中心(通常以红色圆点图标表示)推送重要信息。这些通知可能包括:
    • 审批信息:您发起的审批事项的状态,以及最新的审批事件。
    • 待办事项:需要您操作的实现,如审批事项、问卷调查、被其他用户@的内容等。
    • 文档处理状态:如“文件 ‘Q3-Financial-Report.docx’ 已成功上传并索引。”或“文件 ‘scan.pdf’ 解析失败,请检查文件格式。”
    • 系统公告:如“8月21日凌晨1点-5点将进行系统升级,升级期间系统无法提供访问,敬请谅解!”
    • 系统警报:如“知识库容量已达90%,请及时清理或扩容。”
    • 任务完成提示:如“销售助手机器人已成功部署。”

定期检查通知中心,可以帮助您及时发现并解决问题,确保工作流程的顺畅。

第二部分:新用户实战指南

第3章:创建并填充您的第一个知识库

知识库是 TorchV AIS 系统智能回答的基础。本章将手把手教您如何从零开始,创建一个功能完备的知识库。值得注意的是,TorchV 系统的一大优势在于其对企业环境中普遍存在的传统文档格式(如 doc、xls、ppt、pdf等)进行了深度优化,这极大地降低了企业引入AI技术的门槛。许多大型企业和机构并未将其全部历史文档现代化,这一特性确保了他们可以无缝地利用这些宝贵的存量数据资产。

另外,如果您希望知识文档导入和知识构建实现自动化,可参考“5.2 数据源配置与同步”章节。

image-20250823120023692

图:知识库管理界面。

3.1 步骤详解:创建一个新的知识库

  1. 在左侧主导航菜单中,点击 知识库
  2. 在知识库列表页面,点击右上角的 “+ 创建知识库” 按钮。
  3. 在“创建知识库”界面中进行以下操作:
    • 知识库适用范围:默认选择“团队知识库”,用于企业/组织内部的知识共建共享。您也可以选择“个人知识库”,用于个人知识的构建与管理,但每个用户仅限创建一个“个人知识库”。
    • 知识库类型:分为通用知识库数据库直连结构化知识库(未正式发布),默认情况下选择通用知识库,用于处理PDF、Word、Excel、PPT等非结构化文档。如果您需要为ChatBI(或问数)创建知识库,可选择数据库直连类型的知识库。
    • 知识库名称:为您的知识库起一个清晰易懂的名称,例如“人力资源政策库”或“产品技术规格库”。建议遵循统一的命名规范。
    • 知识库描述(可选):简要描述该知识库的用途和包含的内容范围。
    • 标签(可选):可帮助用户快速检索知识库,如需要设置多个标签,可使用回车添加。
    • 权限配置:设置初始的访问控制级别。您可以选择将其设为私有(仅自己可见),稍后再通过“+添加协作者”,增加特定组织(企业)、团队(部门)或用户开放权限(包括管理、编辑、下载和查看等操作权限)。针对某些公开性质的知识库,也可以选择“公开可见”,默认全员可见,可通过“+添加协作者”邀请编辑者。
    • 高级配置:适合于专业用户的知识库配置项,包括潜入(Embedding)模型选择,解析引擎和解析模式配置,和文档切分模式(包括固定字符Size切割、语义切割和按分隔符切割等)。
  4. 点击右上角的 “创建知识库” 按钮。您的第一个知识库就成功创建了。

image-20250823161535717

图:创建知识库界面

3.2 数据注入流程:上传您的第一批文档

创建知识库后,下一步就是向其中填充内容。

image-20250825142959677

图:知识库的文档目录页面。

知识库分为三个主要入口,包括主页知识库调试全部知识库。主页主要是配置知识库的快捷入口,查看动态和热门文档等。知识库调试的内容比较多,包括检索调试和问答调试。我们在这一章节主要聚焦在“全部知识库”这个入口,也是知识库的文档列表板块。

接下来,我们来上传第一批文档:

  1. 在知识库的文档列表中,点击您刚刚创建的知识库名称,进入其列表页面(点击“全部知识库”)。
  2. 您会在顶部看到一排上传icon,第一个就是“点击或拖拽文件上传”这个文件上传区域。我们可以先上传一个本地的文件(支持.pdf、.doc、.docx、.xls、.xlsx、.ppt、.pptx、.md、.epub、.txt等后缀的文件),您可以通过以下两种方式上传文档:
    • 拖放上传:直接将文件或文件夹从您的电脑桌面拖拽到上传区域。
    • 点击选择:点击上传区域,会弹出文件选择对话框,您可以浏览并选择一个或多个文件进行上传。
  3. 上传开始后,您可以在下方的 处理队列 中看到每个文件的状态。状态通常包括“等待中”、“处理中”、“已完成”或“失败”。系统支持批量上传和后台处理,您可以在文件处理期间执行其他操作。因为涉及到上传通道拥挤,后台设置了队列等待和调度机制,所以文档开始上传的开始时间会是上传之后的0-2分钟左右。

除了上传本地文件之外,AIS还提供了多种知识构建方式:

  • 在线文档:打开在线多人实时编辑器,手动创建可编辑的文档,发布之后自动进入文件解析、切片和嵌入等操作。
  • WEB网页:导入互联网网页的url,导入网页内容,用户可以通过html元素选择爬取更精确的内容。该功能不支持拓扑爬取,只支持限定网页url的内容获取。
  • QA对/QA对批量:用户可以通过excel格式批量导入企业原有QA对,或者手动创建新的QA对,以及QA对标准问题的多个相似问法。

另外还有“新建文件夹”,文件夹主要是为了方便知识管理,实现目录结构。

3.3 支持的文件格式与最佳实践

TorchV AIS 系统支持广泛的文件格式,其强大的解析能力源于底层的 torchv-unstructured 库,该库继承了 Apache Tika、Apache POI 等成熟的Java库的优点构建,确保了高兼容性和解析精度。

  • 支持格式列表
    • 文档:DOC, DOCX,PPT,PPTX,PDF (文本型), RTF, TXT,EPUB等;
    • 表格:XLS, XLSX, CSV
    • 演示文稿:PPT, PPTX
    • 以及其他多种常见格式。
  • 最佳实践建议
    • Word 文档 (DOC/DOCX):为了获得最佳的解析效果,建议使用内置的“标题1”、“标题2”等样式来组织文档结构。这有助于系统更好地理解章节层次。
    • Excel 表格 (XLS/XLSX):确保数据以规范的表格形式存在。为表格区域命名,并为每一列提供清晰的标题行。避免使用过于复杂的合并单元格,尽管系统对此有优化处理,但结构清晰的表格效果更佳。后续AIS也会提供半结构化的存储格式,既能实现文本向量化,同时也具备数据计算的优点。
    • PDF 文档:优先使用由源文件(如Word)直接生成的文本型PDF,而非扫描件生成的图片型PDF。对于图片型PDF,系统需要进行OCR(光学字符识别),其准确率可能受图像质量影响。
    • 文件命名:使用清晰、有描述性的文件名,这有助于后续的自动打标、管理和追溯。

3.4 深入理解高级解析引擎

当您上传一个文件时,系统后台的 torchv-unstructured 引擎会执行一系列复杂操作。它不仅仅是简单地提取文本。其“智能表格解析”功能能够分析表格的结构,准确识别行、列,甚至能正确处理合并单元格,将表格数据以结构化的形式保留下来。这对于需要从报告或规格书中提取精确参数的场景至关重要。因为在RAG模型中,如果表格的结构信息丢失,模型将无法理解数据之间的关系(例如,哪个数值对应哪个产品型号),从而导致回答错误。通过保留这些结构化信息,TorchV确保了知识的完整性和准确性,为后续的精准问答奠定了坚实的基础。

第4章:创建并发布第一个ChatBot应用

TorchV AIS 平台的核心承诺之一是“开箱即用”。本章将引导您利用系统的向导功能,快速创建一个功能齐全的对话机器人(ChatBot),并将其与您刚刚创建的知识库连接起来。

image-20250823224051755

图:创建一个对话机器人。

4.1 构建一个“开箱即用”的ChatBot

  1. 在左侧主导航菜单中,点击 应用中心,选择“我的应用”选项卡。
  2. 在应用列表右上角,点击 “新建应用”,然后选择 “ChatBot智能问答” 应用类型。
  3. 填写应用名称,“HR政策问答助手”。
  4. 应用图标(可选):上传一个代表该应用的图片。
  5. 应用标签(可选):创建标签,方便后续通过标签快速查找应用。
  6. 应用简介:必须输入至少5个字符的应用介绍,方便其他用户了解应用大致内容。
  7. 点击 “确定” 完成基本配置。

4.2 应用配置说明

进入ChatBot的详细配置页之后,我们发现刚才填写的内容已经在“基本信息”中,并且系统为您自动分配了“开发信息”的内容,如用于对接外部应用的AccessToken,以及接口文档

image-20250823223329844

图:应用配置页。

接下来是最关键的操作,它为您的应用赋予真正的“知识大脑”和使用场景。

  1. 我们可以直接选择上图二级菜单中的“参数配置”菜单,选择“绑定知识库”选项卡,您会看到一个您当前可用的知识库列表。
  2. 找到并选中您在第3.1章节中创建的知识库(例如,“人力资源政策库”),选择它。当然您可以为一个应用关联一个或多个知识库。
  3. 点击 “绑定知识库”。系统将自动完成应用和知识库的关联过程。

通过这个简单的关联操作,您就将ChatBot应用的回答范围限定在了您所提供的、经过验证的文档内容中。这正是RAG架构的核心优势:让AI的回答有据可依。

4.3 创建您的可视化应用界面

TorchV AIS为用户提供了快速的ChatBot应用界面配置工具,这是一个所见即所得的创作过程。

image-20250823225343050

图:应用的可视化界面配置。

我们可以通过输入或选择打造您想要的ChatBot界面,如改变欢迎语,界面主色调,嵌入类型,机器人头像等一系列详细的配置。而一旦应用发布,其对外的展示形式和您的配置一致。

4.4 在沙箱环境中进行初步测试与交互

image-20250823225034072

图:对话调试。

每个创建的应用都带有一个内置的测试沙箱,让您可以在正式发布前进行充分的测试和调试。

  1. 在应用中心列表中,找到您刚刚创建的ChatBot应用,点击其名称进入管理界面。
  2. 在左侧的二级菜单中,您会看到一个 “对话调试” 菜单,点击进入。
  3. 在对话调试界面中,您可以在右侧的模拟界面(和您在4.3章节中已经配置的界面不同)中,尝试提出一些与您上传文档内容相关的问题。例如,如果您的知识库包含员工手册,可以提问:
    • “公司的年假政策是怎样的?”
    • “报销流程需要哪些材料?”
    • “试用期是多久?”
  4. 观察ChatBot应用的回答。一个好的回答应该直接、准确地引用您文档中的内容。您还可以测试一些边界问题,例如文档中没有提及的内容,以验证您设置的默认回答是否生效。
  5. 您可以通过在左侧的配置项中改写 Prompt,调整参数,以及临时选择绑定其他知识库等方式进行不断调试,以达到最佳使用效果。
  6. 请注意,以上调试均在沙箱内执行,其配置的修改不会影响到您的应用配置,而是作为一个调试参考。所以您还需要按最佳的配置内容,在“参数配置”中重新设定并保存,才能让应用真正生效。

通过这个简单的三步流程,您已经成功地将静态文档转化为了一个可7x24小时提供服务的智能问答机器人,接下来我们就来做最后的发布工作。

4.5 发布您的应用

为了适应不同的使用场景需求,TorchV AIS的应用发布存在多种方式,包括:

  • 分享&发布(应用上架)
    • 分享应用市场:点击“上架”按钮,应用就会在应用中心的首页出现。当然,您可以在“成员管理”菜单中设置应用权限,可指定组织、团队或人员可见。
    • 分享平台:您也可以通过分享链接让其他用户直接在PC端和手机端的浏览器上直接打开访问。或者使用“一键嵌入”方式,复制系统给出的一段前端javascript代码,将其黏贴到其他网站(如公司官网)的header文件中,实现全站级别的服务。一键嵌入的应用会在客户端的右下角以小图标的方式展示,用户点击之后会展开对话机器人的界面。
  • 企业集成:如果您的企业正在使用钉钉/企业微信/飞书,AIS也允许您仅仅通过配置钉钉/企业微信/飞书的一些授权信息就为您创建这些办公APP上的对话机器人。

通过以上几步,您的应用已经创建并发布完成了。另外,AIS系统还提供了对话记录查看,反馈和处理等应用维护功能,方便用户对创建的应用进行日常管理。

4.6 创建一个WritAid写作助手

image-20250825222201613

图:WritAid写作助手的配置页面。

通过第四章前面5节的内容,我们已经可以大致清楚如何创建一个ChatBot应用了。TorchV AIS提供了多种应用形式,除了问答窗形式的ChatBot外,还有基于编辑器的WritAid写作助手。因为大多数配置都和ChatBot差不多,所以这里不再重复赘述。我们点击应用首页,进入WritAid写作助手的应用首页,进行下一步操作。

image-20250825222311603

图:WritAid写作助手的应用首页。

在这里的操作比较简单,您只需要点击左下角的“新建”按钮,创建新的文档。

下面我们看一下可以如何在编辑器里面进行AI操作:

image-20250825222939764

图:编辑器页面。

  1. 输入“/”,编辑器会给出一个下拉列表,包括知识库问答、大模型(直接)回答,以及其他一些编辑器功能。
  2. 点击“知识库问答”,输入你的要求,点击回车,WritAid写作助手开始通过知识库问答给出回答。
  3. 等WritAid的回复结束,可以选择“插入到后方”“插入到下方”,内容就会进入编辑器内。
  4. WritAid写作助手和ChatBot不同的地方是我们可以直接对AI给出的内容进行编辑,而且可以通过选中某些文字或某一段内容进行AI编辑,如续写、重写、润色、校对、翻译等。

image-20250825223333880

图:输出内容处理。

image-20250825223550825

图:划词之后的AI操作。

第三部分:系统管理与维护

第5章:高级知识库管理

5.1 针对不同业务需求管理多个知识库

随着系统在企业内的推广,单一知识库将无法满足所有部门的需求。TorchV AIS平台支持创建多个独立的知识库,这是一种关键的治理策略。管理员应根据业务领域或数据敏感性来规划知识库的划分。例如,可以创建以下知识库:

  • HR知识库:包含员工手册、薪酬福利、绩效考核等敏感信息,仅对HR部门和全体员工(只读)开放。
  • 销售知识库:包含产品白皮书、客户案例、竞品分析、报价模板等,仅对销售和市场团队开放。
  • 法务知识库:包含合同模板、合规政策、法律法规等高度机密文件,仅对法务部门的特定成员开放。

这种划分不仅确保了数据的安全隔离,还能提高AI应用的响应相关性。当销售助手查询产品信息时,它只会检索“销售知识库”,避免了被HR政策等无关内容干扰。

但是在实际的企业落地中,划分方式依然存在多种方式,以我们现有的客户分析,包括以下几类:

  • 按组织架构划分:这是最常见的知识库划分方式,一般是按企业的各个职能部门进行划分的。优势在于知识管理可管控到人,缺点是容易形成部门墙,需要增加知识空间等上层知识集合来进行协作。
  • 按产品线划分:产品生产和销售类企业常用的知识库划分方式,如某服务器厂商,按通用服务器、AI服务器、存储和网络进行划分,可在这些知识库内部利用宏组件方式组织产品知识地图,进一步描述各产品型号和组件。
  • 按业务场景划分:知识使用为主导的企业适合该类型知识库划分方式,如某汽车厂商,按售后维修(AFS)、营销活动、老客优惠、到店服务、道路救援、金融租赁、员工关怀等场景化的方式来划分。

问:如何划分您所在企业的知识库?

答:我们的建议是,您的企业如果知识生产较重,特别又是制造型企业,那么采用按产品线划分方式是最优选;如果您的知识库主要是用于问答、查看为主,知识生产和维护的工作量不大,那么可以选择按业务场景划分。如果是介入两者之间,且组织架构体系成熟,那么可以采用按组织架构划分的方式。

5.2 知识加工:数据源配置与同步

image-20250824123318434

图:知识加工首页。

对于大型企业而言,手动上传文档无法满足实时性的要求。系统(根据企业级软件的通用需求推断)应提供与外部数据源的连接器,实现知识的自动同步。管理员可以在知识库设置中配置数据源,例如连接到企业的SharePoint站点、传统知识库如Confluence空间或网络共享文件夹。TorchV AIS在各企业实践中实现的连接更多,还包括邮件、企业微信的群聊信息(需要预先邀请数字员工加入)、OA系统,以及石墨、WPS等文档编辑软件系统。

配置同步任务时,可以设定同步频率(如每小时一次、每天一次、每周一次等)和同步规则(如只同步特定文件夹或带有特定标签的文档)。这样可以确保知识库中的内容始终与源头保持最新,减少了人工维护的成本。另外AIS提供了知识刷新机制,对于重复、过期或冲突的知识进行刷新,保证知识库内的知识健康有效。

image-20250824124938996

图:知识加工的无代码流程编排。

知识加工功能最大的优势是可以在知识导入过程中进行诸多知识处理的工作,用户可以通过无代码平台进行各类操作,主要包括:

  • 选择触发条件:可选Webhook被动触发从外部同步知识导入到知识中,也可以发起定时的主动知识同步,还支持Cron表达式的配置。如果您的知识源来自于TorchV AIS内部的某个知识库,那可以提供的操作将会更多,如在节点创建时、编辑(发布)时、删除时、移动时等等多种状态发生变化之后知识同步的触发。

  • 选择执行动作:系统支持添加多个不同执行任务的执行动作Step,也可以将执行动作Step根据业务顺序组建成包含判断节点和循环的复杂流程。执行动作保护丰富的执行组件,包括:

    • 知识库组件:创建节点、创建副本、添加成员、写入内容、读取内容、设置权限等操作组件;
    • AI组件:让AI执行问答、音频生成、参数提取、图片解读、链接速度、文档总结、知识关联、自动打标等操作;
    • 逻辑工具组件:内置日期时间获取、创建/更新流程变量、条件分支、循环、条件筛选、终止条件等逻辑控制操作。

5.3 归档、版本控制与容量管理

有效的知识库生命周期管理对于维持系统性能和合规性至关重要。

  • 归档与版本控制:对于过时或不再使用的文档,应进行归档处理而不是直接删除,以便于未来审计。系统应支持文档的版本控制,当一个文档被更新时,旧版本可以被保留,确保信息的历史可追溯性。
  • 容量管理:AIS系统容量由用户提供的服务器容量决定,管理员需要定期监控每个知识库的容量使用情况。在分析仪表盘中,可以查看容量占用最大的文档或知识库,并制定清理策略。例如,可以定期归档一年前的项目文档,或删除不再需要的临时文件。当容量接近上限时,应及时联系服务提供商进行扩容,以避免服务中断。

----- 以下内容待续. -------

第6章:用户与访问权限控制

企业级系统的核心要求之一是精细化的权限管理。TorchV AIS 系统采用基于角色的访问控制(RBAC)模型,确保不同职责的用户拥有恰当的操作权限,保障系统和数据的安全。

6.1 理解用户角色与权限

系统预设了多种角色,每种角色对应一组特定的权限。这种设计借鉴了成熟企业软件的最佳实践,管理员无需为每个用户单独配置繁琐的权限,只需为其分配合适的角色即可。

6.2 用户角色权限矩阵

6.3 如何添加、编辑和移除用户

6.4 为特定知识库分配基于角色的访问权限

第7章:系统级配置

7.1 通用系统设置

7.2 安全与合规配置

7.3 私有化部署配置

第四部分:高级功能与应用开发

第8章:精通对话式AI配置

仅仅让机器人回答问题是不够的,企业需要的是一个可靠、可信、行为可控的AI助手。TorchV平台将抽象的“AI安全”理念,转化为用户可以实际操作的配置工具,其中“幻觉控制”是建立企业信任的核心功能。当大语言模型无法在知识库中找到确切答案时,它可能会倾向于“创造”答案,这就是“幻觉”。TorchV提供的工具,正是为了约束这种行为,确保AI的专业性和严谨性,这对于商业应用是至关重要的风险管理手段。

8.1 微调机器人响应:召回得分与应答策略

8.2 实施幻觉控制措施:实践指南

8.3 自定义机器人的个性与欢迎语

第9章:利用分析与运营洞察

TorchV AIS 系统不仅是一个应答工具,更是一个强大的数据洞察引擎。通过分析用户与AI的交互数据,企业可以获得宝贵的业务情报。

9.1 “洞察与推荐”仪表盘

9.2 分析用户查询以获取商业智能

9.3 运用“运营与反馈”模块

第10章:使用 TorchV aPaaS 构建自定义应用

TorchV 平台的设计体现了一种精巧的双层架构,旨在服务于两种截然不同的用户群体。对于业务人员,它提供了简单易用的无代码“机器人构建器”,可以在几分钟内上线一个AI应用。而对于开发者和需要深度集成的企业,它提供了一个强大的AI平台即服务(aPaaS),让开发者可以忽略底层复杂的RAG和Agent技术,专注于实现自身的业务逻辑。本章将作为一份简明的开发者指南,介绍如何利用aPaaS构建超越标准对话机器人的定制化AI解决方案。

10.1 AI平台即服务 (aPaaS) 简介

10.2 API 认证与密钥管理

10.3 核心 API 端点及使用示例

10.4 教程:构建一个定制化销售助手应用

第五部分:附录

附录A:术语表

  • LLM (大语言模型): 在海量文本数据上训练的深度学习模型,能够理解和生成人类语言。
  • RAG (检索增强生成): 一种AI框架,通过从知识库中检索相关信息来增强大语言模型的回答,以提高准确性和减少“幻觉”。
  • 知识库 (Knowledge Base): 在TorchV系统中,指一个用于RAG检索的、经过组织的、有权限控制的文档集合。
  • 幻觉 (Hallucination): 指AI模型生成了看似合理但实际上是虚假或与事实不符的信息的现象。
  • 向量数据库 (Vector Database): 一种专门用于存储和高效检索高维数据(如文本嵌入)的数据库,是RAG系统的核心组件之一。
  • 嵌入 (Embeddings): 将文本等非结构化数据转换为计算机可以理解的数字向量(一串数字)的过程。语义相近的文本会有相似的向量表示。
  • aPaaS (AI Platform-as-a-Service): 将AI能力(如自然语言处理)作为一种平台服务,通过API提供给开发者,使其可以轻松构建AI应用。

附录B:常见问题与故障排查

  • 问题:文档上传失败或处理状态长时间停留在“处理中”。
    • 可能原因1:文件格式不受支持或文件已损坏。
    • 解决方案:请检查文件是否在支持格式列表内,并尝试用相应软件打开以确认文件完好。参考3.3节的最佳实践。
    • 可能原因2:文件过大,超出了单次上传的限制。
    • 解决方案:尝试将大文件拆分成几个小文件后重新上传。
    • 可能原因3:系统暂时繁忙。
    • 解决方案:请稍等片刻。如果问题持续存在,请联系系统管理员。
  • 问题:机器人回答缓慢或超时。
    • 可能原因:知识库规模过大或查询复杂度过高。
    • 解决方案:尝试优化知识库结构,移除不必要的冗余文档。对于私有化部署的用户,可能需要检查服务器资源(CPU、内存)是否充足。
  • 问题:调用API时返回401或403错误。
    • 可能原因1:API密钥不正确或已过期。
    • 解决方案:请在系统中重新生成API密钥,并确保在代码中正确使用了新的密钥。
    • 可能原因2:没有访问指定知识库的权限。
    • 解决方案:请联系系统管理员,确认您的账户已被授予对该知识库的API访问权限。

附录C:高质量知识库构建最佳实践

系统的输出质量,很大程度上取决于输入知识库的质量。遵循“垃圾进,垃圾出”的原则,高质量的知识库是获得精准AI回答的前提。

  • 来源权威性:优先使用官方发布的、经过审核的文档作为知识来源,如官方手册、已发布的政策文件、技术白皮书等。避免使用草稿、个人笔记或未经证实的网络内容。
  • 内容结构化:尽管系统能处理非结构化文本,但结构清晰的文档效果更佳。尽量使用标题、列表、表格来组织内容。一个逻辑清晰的Word文档比一篇杂乱无章的纯文本文件,能提供更高质量的检索结果。
  • 单一事实来源 (Single Source of Truth):避免在知识库中存在多份内容冲突或版本不一的文档。定期审查和清理知识库,确保关于同一主题的信息是一致和最新的。如果一个政策更新了,应及时用新版文件替换或归档旧版文件。
  • 定期维护与更新:知识是动态变化的。应建立一个定期的审查机制(例如每季度一次),检查知识库中的内容是否仍然准确有效,并根据业务发展补充新的知识。利用第9章提到的分析仪表盘,可以发现知识库内容的盲点,作为更新的重点方向。
  • 粒度适中:避免将一个长达数百页的巨型文档直接上传。如果可能,将其按章节或主题拆分成多个逻辑独立的较小文档。这有助于RAG系统更快地定位到最相关的具体段落,提高检索精度。