知识库原理
简介
现在大模型大行其道,我们普通人没有那么多资源,有没有办法搭建一个大模型玩一下呢,答案肯定是有的,我们可以搭建一个知识库,用一下大模型。
总所周知,大模型的训练是需要大量资源的,我们没有这么多资源,那我们就得想办法绕过训练或者减少训练。这时候知识库就是一个比较好的选择,它不需要对大模型进行大量的训练,大模型只是帮我们生成一个类人话的答案。
架构
目前比较用的比较多的就是LangChain框架,这是一种基于Langchain 与 ChatGLM 等大语言模型的本地知识库问答应用实现。
可以从上面的原理图看出知识库的整个实现原理。
1、先加载文件,文件可以是结构化的也可以是非结构化的
2、读取文本,这就很好理解了,将加载进来的文件读取
3、分割文本,将读取的文本分割成一段一段的,便于提取其中的关键字和让内容更内敛