当前位置：首页 > news >正文

做公司网站公司多少钱龙海网站建设公司

news 2025/10/1 3:47:52

做公司网站公司多少钱,龙海网站建设公司,百度海外视频网站建设,西安微信小程序制作公司实现 ChatPDF & RAG：密集向量检索（R）上下文学习（AG） RAG 是啥？实现 ChatPDF怎么优化 RAG？ RAG 是啥？ RAG 是检索增强生成的缩写，是一种结合了信息检索技术与语言生成…

实现 ChatPDF & RAG：密集向量检索（R）+上下文学习（AG）

RAG 是啥？
实现 ChatPDF
怎么优化 RAG？

RAG 是啥？

RAG 是检索增强生成的缩写，是一种结合了信息检索技术与语言生成模型的人工智能技术。

这种技术主要用于增强 LLM 的能力，使其能够生成更准确且符合上下文的答案，同时减少模型幻觉。

RAG通过将检索模型和生成模型结合起来，利用专有数据源的信息（比如多文档）来辅助文本生成。

从本地文档加载到生成语言模型回答的整个流程。

文本分块：
- 加载文件：这一步骤涉及从本地存储读取文件。
- 读取文件：将读取的文件内容转换为文本格式。
- 文本分割：按照一定的规则（例如按段落、句子或词语）将文本分割成小块，便于处理。
向量化存储：
- 文本向量化：使用NLP技术（如TF-IDF、word2vec、BERT）将文本转换为数值向量。
- 存储到向量数据库：将文本的向量存储在向量数据库中，如使用FAISS进行高效存储和检索。
问句向量化：
- 这一步将用户的查询或问题转换为向量，使用的方法应与文本向量化相同，确保在相同的向量空间中比较。
在文本向量中匹配相似向量：
- 通过计算余弦相似度或欧式距离等，找出与查询向量最相似的顶部k个文本向量。
构建问题的上下文：
- 将匹配出的文本作为问题的上下文，与问题一起构成prompt，输入给语言模型。
生成回答：
- 将问题和其上下文提交给语言模型（如GPT系列），由模型生成相应的回答。

通用 RAG 就是如此，最终目的是提供精确和相关的信息回答。

实现 ChatPDF

实现 RAG 步骤有很多步，涉及的知识点也很多，直接上已实现的开源项目，不用深入理解里面每个知识点，能用就行。

开源项目：https://github.com/chatchat-space/Langchain-Chatchat

这个项目是 Apache-2.0 license，开源可商用。

conda create -n chatpdf python==3.11.7   # 创建虚拟环境# 拉取仓库
$ git clone https://github.com/chatchat-space/Langchain-Chatchat.git# 进入目录
$ cd Langchain-Chatchat# 安装全部依赖
$ pip install -r requirements.txt 
$ pip install -r requirements_api.txt
$ pip install -r requirements_webui.txt  # 默认依赖包括基本运行环境（FAISS向量库）。如果要使用 milvus/pg_vector 等向量库，请将 requirements.txt 中相应依赖取消注释再安装。# 模型下载
$ git lfs install
$ git clone https://huggingface.co/THUDM/chatglm4-9b   
$ git clone https://huggingface.co/BAAI/bge-large-zh# 初始化知识库和配置文件
$ python copy_config_example.py
$ python init_database.py --recreate-vs# 启动项目
$ python startup.py -a