# 百度千帆-知识库

# 需求背景

在构建知识库之前,我们先了解一下构建知识库的目的,就是以文生文,简单理解就是以李老师讲过的内容为基础,创造生成类似李老师讲的内容。

# 概念基础:

  • 知识库:知识库是系统化的知识管理单元,其构成了有效的信息组织和检索体系。

  • 文档:一个知识库可以涵盖特定的知识领域,内部包含多个独立的文档。每个文档则是知识库中的一个个体,可以包含大量关于特定主题的信息。

  • 段落:为了更好地组织文档内部的内容,每个文档可以进一步细分为不同的段落。这些段落是对文档主题的更精细的划分,有助于更精确地定位和检索所需的信息。

  • 应用:应用是指具体大模型基于知识增强插件构建的下游应用,一个应用可以关联多个知识库进行本地知识检索问答。

# 知识库与文档,与应用之间的关系

结合以上概念,我们先梳理一下他们之间的关系,可以帮助我们更好的理解背后的原理。

不难发现知识库和应用是属于多对多的关系,即一个应用可以使用多个知识库,一个知识库可以被多个应用引用。

# 创建流程

1、创建应用

2、新建知识库

3、导入配置

  • 上传 pdf、doc、docx 等格式的知识材料

  • 索引模式(中文索引),共用向量数据库,自动分段,嵌入索引

4、知识库与应用相互关联

其他功能:知识库是可以进行再编辑的,知识库的内容(文档)是可以增加或者删除的。

文档质量越高,文档数量越多,知识库的专业度就会更高。

# 用户问答流程闭环

请按留意步骤的序号,以及箭头方向。

通过以上流程,我们不难发现,用户与知识库之间交互的依托是插件。那么就需要我们创建插件,并将应用与插件关联之后,再进行发布上线,最后更新应用的配置,将插件服务引入进来。至此应用与插件服务已相互关联。后续就可以接入应用啦。