Skip to main content

TorchV AI 版本发布日志

v1.7.7

  • PDF解析能力使用自研方法进行替换,在Java端进行重构实现,解决扫描识别、表格解析稳定性等重要问题
  • 所有文件的解析、Embedding工程化Pipeline流程全部在Java端实现,Python端提供非状态的API接口,提升整体系统运行的稳定性
  • Excel解析丢失文件头的Bug
  • Assistant功能在应用中心上线
  • 面板功能发布上线
  • RAG召回丢失上下文的检索优化,充分利用大模型LongContext的能力,对于文本Chunk后<8页的文档,检索问答时使用全部
  • 知识引用功能分值归一化算法优化,Score分值排序与文档相关性更准确
  • ReRank模型升级,使用bge-reranker-v2-m3模型

v1.7.6

  • 应用中心增加标签分类功能
  • 应用中心一键嵌入交互改版,增加默认的主题风格(6种)
  • 问答知识引用增加Rerank排序,将文档引用及大模型响应答案相关性进行排名
  • 问答/反馈记录支持导出,并增加下载中心功能可下载
  • 常规bug修复(llm响应null字符串,prompt超长等)

v1.7.5

  • 解决多文件上传预览失败的问题
  • minio对象存储oss支持(可进行本地化部署的OSS)
  • 对接支持GPT-4o
  • 应用中心增加Agent功能
  • 本地私有化部署标准化处理,变量&Docker环境支持
  • ui交互调整

v1.7.4

  • LLM降价之后的价格调整
  • i18n兼容问题修改
  • 问答长度限制
  • 新账号未创建知识库时无法问答的问题解决

v1.7.3

  • 知识库操作接口对客户开放
  • 知识库批量POST/GET接口
  • 知识库分类和标签,增强管理能力
  • 一键嵌入功能上线
  • 白标演示版本上线

v1.7.2

  • 适配正式环境中的国产Altlas 300I部署
  • 适配正式环境中的V100、A40等显卡

v1.7.1

目前在状态v1.7.1,主要多个大功能即将发布:

  • TorchV Assistant完成POC验证版本
  • 全新问答界面发布
  • 增加Turbo版本(多跳问题开关设置)
  • 模糊问题
  • 英文chunk和NLP模型
  • 演示版本白标的处理,前端单独部署一套用于客户的演示&项目支撑
  • 增加PPT格式的解析&预览(Layout问题)
  • 疑难PDF解析问题解决

v1.7

发布时间:2024-04-12

  • 优化回答内容及响应段落原文内容引用的UI交互效果
  • 本地化部署的代码修改、适配
  • 本地化部署文档&手册编写
  • rerank后,放开top k的参数在配置参数界面中
  • 前端界面I18N的适配,目前主要支持英语&中文两种
  • 问答响应界面Markdown交互效果&性能优化(目前渲染存在性能问题)
  • 多轮交互的幻觉问题及问答参数召回的配置
  • requests请求库添加timeout
  • 前一会话处于翻页状态,在下一个会话中存在问题
  • 抓取的网页存在外网地址,获取时失败的问题解决
  • 持续优化目前问答精准度的问题,思考是否有新的手段在索引、数据工程、检索等方面做优化
  • CSV、Excel导入数据的结构优化&处理
  • CSV、Excel批量QA对导入功能的支持
  • CSV乱码问题解决
  • 增加新版OCR功能,废弃原来版本

v1.6

发布时间: 2024-03-29

首先检索生成的结果再次有明显提升!!!

以下问题全部完结,该版本是立项以来目前最大版本更新,废弃原先的APIKey方式,改用全新的应用中心模式,且在单个应用下面可以进行各类配置和调试。并且可以选择API+一键嵌入方式进行应用开发。

  • Rerank策略重大优化 3 hours ageo

  • 表格的问答效果优化 5 hours ago

  • 更改数据集的呈现方式 5 hours ago

  • PDF解析通过OCR识别,图片提取失败的bug 9 hours ago

  • 问答界面,知识库勾选状态交互组件优化 yesterday

  • rag检索召回多跳问题优化 yesterday

  • 图片-附件显示问题优化 yesterday

  • 应用中心-增加对话调试功能 yesterday

  • 数据工程提取使用OCR yesterday

  • 平台反馈功能 xiaoymin yesterday

  • 应用中心功能增加 yesterday

  • 问答反馈增加类型 yesterday

  • Markdown\HTML\WEB分段优化 yesterday

  • 在使用期间,登录session会强制过期的问题解决 yesterday

  • 数据解析-多媒体数据(images)如果图片定位、太多的问题 2 days ago

  • word解析表格优化为markdown 2 days ago

  • 提交反馈时增加标签功能收集 2 days ago

  • 升级pdf解析表格注解 3 days ago

  • 计费页面-行为的字眼修改 5 days ago

  • 快速嵌入-SDK 5 days ago

  • 废弃Api keys功能,走应用中心 5 days ago

  • 增加一键嵌入功能 5 days ago

  • subQuery子查询问题 5 days ago

  • 提交反馈信息走MQ解耦 5 days ago

  • 管理后台提交反馈信息时,用户id记录为登录名 5 days ago

  • 大模型的敏感词监测对齐问题 2 weeks ago

  • 各个对接大模型的上下文Token长度参数对齐 2 weeks ago

  • 对接零一万物大模型 2 weeks ago

v1.5

  • 菜单功能待加功能选项,根据app应用来获取不同的菜单列表 2 weeks ago

  • 生产环境租户管理后台升级,增加租户级别字段 2 weeks ago

  • i18n国际化,服务端所有Message都需要处理支持 2 weeks ago

  • cdn加速核心页面 2 weeks ago

  • 改进API keys的存储方式,保证安全性 2 weeks ago

  • HTTPS 网站 证书资源盘点 closed 3 weeks ago

  • 文件类型:txt、markdown、html集中测试,编码修复后 junit 3 weeks ago

  • python 程序日志打印增加行号 3 weeks ago

  • 文本文件编码问题 3 weeks ago

v1.4

v1.4.1

  • 费用明细列表页面,金额增加单位 3 weeks ago

  • 知识库上传文件优化-界面显示 ui 3 weeks ago

  • 纯文本内容上传异常的处理 bug 3 weeks ago

  • 对接月之暗面大模型接口 3 weeks ago

  • 大模型Prompt配置界面对模型、厂商进行分组 3 weeks ago

v1.4.0

  • 租户管理后台新增租户时,增加租户级别功能 3 weeks ago

  • 账户总览界面增加月账单、月消费趋势等图标功能 3 weeks ago

  • 计费系统的MQ事件验证 junit 3 weeks ago

  • 知识库删除后,绑定apikey,显示id,异常bug 3 weeks ago

  • 增加对千问14B-chat、千问1.5-14B-chat模型的支持 3 weeks ago

  • 计费系统加入 3 weeks ago

  • 当召回的知识内容包含和Prompt模版冲突的字符时,会有bug 3 weeks ago

  • api接口传递知识库列表时,为空字符串的验证bug 3 weeks ago

  • 知识库增加空间大小统计功能,非实时统计,点击后统计出结果并更新 3 weeks ago

  • QA对新建时,需要计算字节大小,计算在总流量空间中 3 weeks ago

  • 上传文件名称长度支持到1000字符 3 weeks ago

  • 大文件上传预览超时bug 3 weeks ago

  • 知识库文件显示文件大小 3 weeks ago

  • 登录token 时间修改为7200秒 3 weeks ago

  • 租户增加产品价格级别字段 last month

  • 记录问答message通过MQ系统 last month

  • 用户操作手册 last month