知识库

常见问题

知识库常见问题

文件解析失败

未打开 PDF 增强解析。如果在上传文件设置参数时，没有打开【PDF 增强解析】设置时，需要在 Admin 后台正确配置 OCR 模块以支持增强解析。

文件中文乱码

将文件另存为 UTF-8 编码格式。

文件处理模型与索引模型

文件处理模型：用于数据处理的【增强处理】和【问答拆分】。在【增强处理】中，生成相关问题和摘要，在【问答拆分】中执行问答对生成。
索引模型：用于向量化，即通过对文本数据进行处理和组织，构建出一个能够快速查询的数据结构。

Excel 文件导入

xlsx 等都可以上传的，不止支持 CSV。

Tokens 计算方式

统一按 gpt3.5 标准。

恢复重排模型

config.json 文件里面配置后就可以勾选重排模型

套餐到期后的数据保留

免费版是三十天不登录后清空知识库，应用不会动。其他付费套餐到期后自动切免费版。

知识库结果过多导致回答中断

FastGPT 回复长度计算公式:

最大回复=min(配置的最大回复（内置的限制），最大上下文（输入和输出的总和）- 历史记录)

18K 模型 ->输入与输出的和

输出增多 ->输入减小

所以可以：

检查配置的最大回复（回复上限）
减小输入来增大输出，即减小历史记录，在工作流其实也就是“聊天记录”

配置的最大回复：

另外私有化部署的时候，后台配模型参数，可以在配置最大上文时，预留一些空间，比如 128000 的模型，可以只配置 120000, 剩余的空间后续会被安排给输出

聊天记录触发上下文限制

FastGPT 回复长度计算公式:

最大回复=min(配置的最大回复（内置的限制），最大上下文（输入和输出的总和）- 历史记录)

18K 模型 ->输入与输出的和

输出增多 ->输入减小

所以可以：

检查配置的最大回复（回复上限）
减小输入来增大输出，即减小历史记录，在工作流其实也就是“聊天记录”

配置的最大回复：

另外，私有化部署的时候，后台配模型参数，可以在配置最大上文时，预留一些空间，比如 128000 的模型，可以只配置 120000, 剩余的空间后续会被安排给输出。

知识库页面闪烁

未配置索引模型，补齐索引模型配置。

在 GitHub 上编辑

第三方知识库开发

本节详细介绍如何在FastGPT上自己接入第三方知识库

团队&成员组&权限

如何管理 FastGPT 团队、成员组及权限设置

本页导航

文件解析失败

文件中文乱码

文件处理模型与索引模型

Excel 文件导入

Tokens 计算方式

恢复重排模型

套餐到期后的数据保留

知识库结果过多导致回答中断

聊天记录触发上下文限制

知识库页面闪烁