TorchV AI 版本发布日志
v1.8.4
本次版本主要更新内容:
- 向量数据库引擎扩展,增加云厂商的向量数据库中间件,支撑Saas业务
- 大模型在管理端动态管理,更加方便对模型的上下线、定价修改、接入、本地化部署等方式
- 去除知识库文件上传去重校验
- RAG检索器相关流程的Prompt优化(基于FewShot)
- 企业微信应用的支持
v1.8.3
主要更新内容:
- RAG对话上下文ReWrite的Prompt优化
- Sharding多租户模式下的查询知识库异常的bug修复
- Chat2DB修改数据源未修改数据源状态的bug
v1.8.0 (重大版本更新)
ChatDB功能初问世,核心功能提升明显
本次版本主要更新内容:
- 增加同关系型数据库的对话能力(Chat2DB),包括MySQL、MariaDB数据库类型的支持
- 增加原文定位引用功能,内容输出后可以直接点击查看原文知识
- 增加钉钉企业应用机器人的支持,可以在企业内部轻松集成TorchV的应用,详见文档
- 多租户底层数据存储架构的升级,Sharding模式更广的支持海量数据的存储&扩展
- PDF、PPT格式针对图片的提取处理优化,PDF中启动OCR机制的功能优化
- Assistant应用三方渠道集成的兼容性支撑
- 问答反馈增加运营处理功能,可以快速新建知识。修复反馈内容导出Excel的Bug
- 财务/面板等界面的排版优化调整
v1.7.10
主版本更新内容
- ReRanker使用Gitee AI的模型接口
- 上传增加epub电子书的格式支持、PDF解析多线程的问题bug
- 百川2-192k模型下线
- 问答反馈增加标注功能
(产品)Assistant功能优化
- Assistant放开分享地址,增加三方用户参数的传入分享
- 流式Markdown输出的渲染问题解决
- 主界面菜单排版、功能分组
- 增加RAG问答检索的原文引用功能
v1.7.9.3
- 修复Excel导出bug
- 开户时,租户的存储容量和官方网站对齐
- 后端支持文件处理进度
v1.7.9
- 知识库文本撰写能力,放开富文本框,并增加流程图的绘制能力
- 文本、markdown类型的知识文件,可以二次编辑
- 解决PDF双排的解析问题
- FAQ问答库增加相似问法自动生成的功能
- 知识库embedding处理进度
v1.7.8
- Assistant优化MVP版本上线
- 对接大模型厂商DeepSeek、MiniMax
- 一键嵌入增加知识引用查看功能【后台配置可开关】
- 任务调度Task幂等执行问题&优化
- 知识库文件增加重置功能,对于处理失败的文件,可以重新跑向量化Embedding的pipeline
v1.7.7
- PDF解析能力使用自研方法进行替换,在Java端进行重构实现,解决扫描识别、表格解析稳定性等重要问题
- 所有文件的解析、Embedding工程化Pipeline流程全部在Java端实现,Python端提供非状态的API接口,提升整体系统运行的稳定性
- Excel解析丢失文件头的Bug
- Assistant功能在应用中心上线
- 面板功能发布上线
- RAG召回丢失上下文的检索优化,充分利用大模型LongContext的能力,对于文本Chunk后<8页的文档,检索问答时使用全部
- 知识引用功能分值归一化算法优化,Score分值排序与文档相关性更准确
- ReRank模型升级,使用bge-reranker-v2-m3模型
v1.7.6
- 应用中心增加标签分类功能
- 应用中心一键嵌入交互改版,增加默认的主题风格(6种)
- 问答知识引用增加Rerank排序,将文档引用及大模型响应答案相关性进行排名
- 问答/反馈记录支持导出,并增加下载中心功能可下载
- 常规bug修复(llm响应null字符串,prompt超长等)
v1.7.5
- 解决多文件上传预览失败的问题
- minio对象存储oss支持(可进行本地化部署的OSS)
- 对接支持GPT-4o
- 应用中心增加Agent功能
- 本地私有化部署标准化处理,变量&Docker环境支持
- ui交互调整
v1.7.4
- LLM降价之后的价格调整
- i18n兼容问题修改
- 问答长度限制
- 新账号未创建知识库时无法问答的问题解决
v1.7.3
- 知识库操作接口对客户开放
- 知识库批量POST/GET接口
- 知识库分类和标签,增强管理能力
- 一键嵌入功能上线
- 白标演示版本上线
v1.7.2
- 适配正式环境中的国产Altlas 300I部署
- 适配正式环境中的V100、A40等显卡
v1.7.1
目前在状态v1.7.1,主要多个大功能即将发布:
- TorchV Assistant完成POC验证版本
- 全新问答界面发布
- 增加Turbo版本(多跳问题开关设置)
- 模糊问题
- 英文chunk和NLP模型
- 演示版本白标的处理,前端单独部署一套用于客户的演示&项目支撑
- 增加PPT格式的解析&预览(Layout问题)
- 疑难PDF解析问题解决
v1.7
发布时间:2024-04-12
- 优化回答内容及响应段落原文内容引用的UI交互效果
- 本地化部署的代码修改、适配
- 本地化部署文档&手册编写
- rerank后,放开top k的参数在配置参数界面中
- 前端界面I18N的适配,目前主要支持英语&中文两种
- 问答响应界面Markdown交互效果&性能优化(目前渲染存在性能问题)
- 多轮交互的幻觉问题及问答参数召回的配置
- requests请求库添加timeout
- 前一会话处于翻页状态,在下一个会话中存在问题
- 抓取的网页存在外网地址,获取时失败的问题解决
- 持续优化目前问答精准度的问题,思考是否有新的手段在索引、数据工程、检索等方面做优化
- CSV、Excel导入数据的结构优化&处理
- CSV、Excel批量QA对导入功能的支持
- CSV乱码问题解决
- 增加新版OCR功能,废弃原来版本
v1.6
发布时间: 2024-03-29
首先检索生成的结果再次有明显提升!!!
以下问题全部完结,该版本是立项以来目前最大版本更新,废弃原先的APIKey方式,改用全新的应用中心模式,且在单个应用下面可以进行各类配置和调试。并且可以选择API+一键嵌入方式进行应用开发。
Rerank策略重大优化 3 hours ageo
表格的问答效果优化 5 hours ago
更改数据集的呈现方式 5 hours ago
PDF解析通过OCR识别,图片提取失败的bug 9 hours ago
问答界面,知识库勾选状态交互组件优化 yesterday
rag检索召回多跳问题优化 yesterday
图片-附件显示问题优化 yesterday
应用中心-增加对话调试功能 yesterday
数据工程提取使用OCR yesterday
平台反馈功能 xiaoymin yesterday
应用中心功能增加 yesterday
问答反馈增加类型 yesterday
Markdown\HTML\WEB分段优化 yesterday
在使用期间,登录session会强制过期的问题解决 yesterday
数据解析-多媒体数据(images)如果图片定位、太多的问题 2 days ago
word解析表格优化为markdown 2 days ago
提交反馈时增加标签功能收集 2 days ago
升级pdf解析表格注解 3 days ago
计费页面-行为的字眼修改 5 days ago
快速嵌入-SDK 5 days ago
废弃Api keys功能,走应用中心 5 days ago
增加一键嵌入功能 5 days ago
subQuery子查询问题 5 days ago
提交反馈信息走MQ解耦 5 days ago
管理后台提交反馈信息时,用户id记录为登录名 5 days ago
大模型的敏感词监测对齐问题 2 weeks ago
各个对接大模型的上下文Token长度参数对齐 2 weeks ago
对接零一万物大模型 2 weeks ago
v1.5
菜单功能待加功能选项,根据app应用来获取不同的菜单列表 2 weeks ago
生产环境租户管理后台升级,增加租户级别字段 2 weeks ago
i18n国际化,服务端所有Message都需要处理支持 2 weeks ago
cdn加速核心页面 2 weeks ago
改进API keys的存储方式,保证安全性 2 weeks ago
HTTPS 网站 证书资源盘点 closed 3 weeks ago
文件类型:txt、markdown、html集中测试,编码修复后 junit 3 weeks ago
python 程序日志打印增加行号 3 weeks ago
文本文件编码问题 3 weeks ago
v1.4
v1.4.1
费用明细列表页面,金额增加单位 3 weeks ago
知识库上传文件优化-界面显示 ui 3 weeks ago
纯文本内容上传异常的处理 bug 3 weeks ago
对接月之暗面大模型接口 3 weeks ago
大模型Prompt配置界面对模型、厂商进行分组 3 weeks ago
v1.4.0
租户管理后台新增租户时,增加租户级别功能 3 weeks ago
账户总览界面增加月账单、月消费趋势等图标功能 3 weeks ago
计费系统的MQ事件验证 junit 3 weeks ago
知识库删除后,绑定apikey,显示id,异常bug 3 weeks ago
增加对千问14B-chat、千问1.5-14B-chat模型的支持 3 weeks ago
计费系统加入 3 weeks ago
当召回的知识内容包含和Prompt模版冲突的字符时,会有bug 3 weeks ago
api接口传递知识库列表时,为空字符串的验证bug 3 weeks ago
知识库增加空间大小统计功能,非实时统计,点击后统计出结果并更新 3 weeks ago
QA对新建时,需要计算字节大小,计算在总流量空间中 3 weeks ago
上传文件名称长度支持到1000字符 3 weeks ago
大文件上传预览超时bug 3 weeks ago
知识库文件显示文件大小 3 weeks ago
登录token 时间修改为7200秒 3 weeks ago
租户增加产品价格级别字段 last month
记录问答message通过MQ系统 last month
用户操作手册 last month