Langchain-Chatchat/server/knowledge_base/kb_service/pg_kb_service.py

import json
from typing import List, Dict, Optional

from langchain.embeddings.base import Embeddings
from langchain.schema import Document
from langchain.vectorstores import PGVector
from langchain.vectorstores.pgvector import DistanceStrategy
from sqlalchemy import text

from configs import kbs_config

from server.knowledge_base.kb_service.base import SupportedVSType, KBService, EmbeddingsFunAdapter, \
    score_threshold_process
from server.knowledge_base.utils import load_embeddings, KnowledgeFile
from server.utils import embedding_device as get_embedding_device


class PGKBService(KBService):
    pg_vector: PGVector

    def _load_pg_vector(self, embedding_device: str = get_embedding_device(), embeddings: Embeddings = None):
        _embeddings = embeddings
        if _embeddings is None:
            _embeddings = load_embeddings(self.embed_model, embedding_device)
        self.pg_vector = PGVector(embedding_function=EmbeddingsFunAdapter(_embeddings),
                                  collection_name=self.kb_name,
                                  distance_strategy=DistanceStrategy.EUCLIDEAN,
                                  connection_string=kbs_config.get("pg").get("connection_uri"))

    def get_doc_by_id(self, id: str) -> Optional[Document]:
        with self.pg_vector.connect() as connect:
            stmt = text("SELECT document, cmetadata FROM langchain_pg_embedding WHERE collection_id=:id")
            results = [Document(page_content=row[0], metadata=row[1]) for row in
                       connect.execute(stmt, parameters={'id': id}).fetchall()]
            if len(results) > 0:
                return results[0]

    def do_init(self):
        self._load_pg_vector()

    def do_create_kb(self):
        pass

    def vs_type(self) -> str:
        return SupportedVSType.PG

    def do_drop_kb(self):
        with self.pg_vector.connect() as connect:
            connect.execute(text(f'''
                    -- 删除 langchain_pg_embedding 表中关联到 langchain_pg_collection 表中 的记录
                    DELETE FROM langchain_pg_embedding
                    WHERE collection_id IN (
                      SELECT uuid FROM langchain_pg_collection WHERE name = '{self.kb_name}'
                    );
                    -- 删除 langchain_pg_collection 表中 记录
                    DELETE FROM langchain_pg_collection WHERE name = '{self.kb_name}';
            '''))
            connect.commit()

    def do_search(self, query: str, top_k: int, score_threshold: float, embeddings: Embeddings):
        self._load_pg_vector(embeddings=embeddings)
        return score_threshold_process(score_threshold, top_k,
                                       self.pg_vector.similarity_search_with_score(query, top_k))

    def do_add_doc(self, docs: List[Document], **kwargs) -> List[Dict]:
        ids = self.pg_vector.add_documents(docs)
        doc_infos = [{"id": id, "metadata": doc.metadata} for id, doc in zip(ids, docs)]
        return doc_infos

    def do_delete_doc(self, kb_file: KnowledgeFile, **kwargs):
        with self.pg_vector.connect() as connect:
            filepath = kb_file.filepath.replace('\\', '\\\\')
            connect.execute(
                text(
                    ''' DELETE FROM langchain_pg_embedding WHERE cmetadata::jsonb @> '{"source": "filepath"}'::jsonb;'''.replace(
                        "filepath", filepath)))
            connect.commit()

    def do_clear_vs(self):
        self.pg_vector.delete_collection()
        self.pg_vector.create_collection()


if __name__ == '__main__':
    from server.db.base import Base, engine

    # Base.metadata.create_all(bind=engine)
    pGKBService = PGKBService("test")
    # pGKBService.create_kb()
    # pGKBService.add_doc(KnowledgeFile("README.md", "test"))
    # pGKBService.delete_doc(KnowledgeFile("README.md", "test"))
    # pGKBService.drop_kb()
    print(pGKBService.get_doc_by_id("f1e51390-3029-4a19-90dc-7118aaa25772"))
    # print(pGKBService.search_docs("如何启动api服务"))
milvus/pg kb_service需要实现get_doc_by_id方法 2023-09-04 16:40:05 +08:00			`import json`
升级注意数据库表发生变化，需要重建知识库新功能 - 增加FileDocModel库表，存储知识文件与向量库Document ID对应关系以及元数据，便于检索向量库 - 增加FileDocModel对应的数据库操作函数（这些函数主要是给KBService调用，用户一般无需使用）： - list_docs_from_db: 根据知识库名称、文件名称、元数据检索对应的Document IDs - delete_docs_from_db: 根据知识库名称、文件名称删除对应的file-doc映射 - add_docs_to_db: 添加对应的file-doc映射 - KBService增加list_docs方法，可以根据文件名、元数据检索Document。当前仅支持FAISS，待milvus/pg实现get_doc_by_id方法后即自动支持。 - 去除server.utils对torch的依赖待完善 - milvus/pg kb_service需要实现get_doc_by_id方法 2023-09-01 22:54:57 +08:00			`from typing import List, Dict, Optional`
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00
			`from langchain.embeddings.base import Embeddings`
			`from langchain.schema import Document`
			`from langchain.vectorstores import PGVector`
适配score_threshold 2023-08-27 11:21:10 +08:00			`from langchain.vectorstores.pgvector import DistanceStrategy`
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00			`from sqlalchemy import text`

发版：v0.2.5 (#1620) * 优化configs (#1474) * remove llm_model_dict * optimize configs * fix get_model_path * 更改一些默认参数，添加千帆的默认配置 * Update server_config.py.example * fix merge conflict for #1474 (#1494) * 修复ChatGPT api_base_url错误；用户可以在model_config在线模型配置中覆盖默认的api_base_url (#1496) * 优化LLM模型列表获取、切换的逻辑： (#1497) 1、更准确的获取未运行的可用模型 2、优化WEBUI模型列表显示与切换的控制逻辑 * 更新migrate.py和init_database.py，加强知识库迁移工具： (#1498) 1. 添加--update-in-db参数，按照数据库信息，从本地文件更新向量库 2. 添加--increament参数，根据本地文件增量更新向量库 3. 添加--prune-db参数，删除本地文件后，自动清理相关的向量库 4. 添加--prune-folder参数，根据数据库信息，清理无用的本地文件 5. 取消--update-info-only参数。数据库中存储了向量库信息，该操作意义不大 6. 添加--kb-name参数，所有操作支持指定操作的知识库，不指定则为所有本地知识库 7. 添加知识库迁移的测试用例 8. 删除milvus_kb_service的save_vector_store方法 * feat: support volc fangzhou * 使火山方舟正常工作，添加错误处理和测试用例 * feat: support volc fangzhou (#1501) * feat: support volc fangzhou --------- Co-authored-by: liunux4odoo <41217877+liunux4odoo@users.noreply.github.com> Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> * 第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> * 添加configs/prompt_config.py，允许用户自定义prompt模板： (#1504) 1、默认包含2个模板，分别用于LLM对话，知识库和搜索引擎对话 2、 server/utils.py提供函数get_prompt_template，获取指定的prompt模板内容（支持热加载） 3、 api.py中chat/knowledge_base_chat/search_engine_chat接口支持prompt_name参数 * 增加其它模型的参数适配 * 增加传入矢量名称加载 * 1. 搜索引擎问答支持历史记录； 2. 修复知识库问答历史记录传参错误：用户输入被传入history，问题出在webui中重复获取历史消息，api知识库对话接口并无问题。 * langchain日志开关 * move wrap_done & get_ChatOpenAI from server.chat.utils to server.utils (#1506) * 修复faiss_pool知识库缓存key错误 (#1507) * fix ReadMe anchor link (#1500) * fix : Duplicate variable and function name (#1509) Co-authored-by: Jim <zhangpengyi@taijihuabao.com> * Update README.md * fix #1519: streamlit-chatbox旧版BUG，但新版有兼容问题，先在webui中作处理，并限定chatbox版本 (#1525) close #1519 * 【功能新增】在线 LLM 模型支持阿里云通义千问 (#1534) * feat: add qwen-api * 使Qwen API支持temperature参数；添加测试用例 * 将online-api的sdk列为可选依赖 --------- Co-authored-by: liunux4odoo <liunux@qq.com> * 处理序列化至磁盘的逻辑 * remove depends on volcengine * update kb_doc_api: use Form instead of Body when upload file * 将所有httpx请求改为使用Client，提高效率，方便以后设置代理等。 (#1554) 将所有httpx请求改为使用Client，提高效率，方便以后设置代理等。将本项目相关服务加入无代理列表，避免fastchat的服务器请求错误。(windows下无效) * update QR code * update readme_en,readme,requirements_api,requirements,model_config.py.example:测试baichuan2-7b;更新相关文档 * 新增特性：1.支持vllm推理加速框架；2. 更新支持模型列表 * 更新文件：1. startup,model_config.py.example,serve_config.py.example,FAQ * 1. debug vllm加速框架完毕；2. 修改requirements,requirements_api对vllm的依赖；3.注释掉serve_config中baichuan-7b的device为cpu的配置 * 1. 更新congif中关于vllm后端相关说明；2. 更新requirements，requirements_api; * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) * Dev (#1613) * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 * issue提到的一个bug * 温度最小改成0，但是不应该支持负数 * 修改了最小的温度 * fix: set vllm based on platform to avoid error on windows * fix: langchain warnings for import from root * 修复webui中重建知识库以及对话界面UI错误 (#1615) * 修复bug:webui点重建知识库时，如果存在不支持的文件会导致整个接口错误;migrate中没有导入CHUNK_SIZE * 修复：webui对话界面的expander一直为running状态；简化历史消息获取方法 * 根据官方文档，添加对英文版的bge embedding的指示模板 (#1585) Co-authored-by: zR <2448370773@qq.com> * Dev (#1618) * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 * issue提到的一个bug * 温度最小改成0，但是不应该支持负数 * 修改了最小的温度 * 增加了部分Agent支持和修改了启动文件的部分bug * 修改了GPU数量配置文件 * 1 1 * 修复配置文件错误 * 更新readme，稳定测试 * 更改readme 0928 (#1619) * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 * issue提到的一个bug * 温度最小改成0，但是不应该支持负数 * 修改了最小的温度 * 增加了部分Agent支持和修改了启动文件的部分bug * 修改了GPU数量配置文件 * 1 1 * 修复配置文件错误 * 更新readme，稳定测试 * 更新readme * fix readme * 处理序列化至磁盘的逻辑 * update version number to v0.2.5 --------- Co-authored-by: qiankunli <qiankun.li@qq.com> Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> Co-authored-by: zR <2448370773@qq.com> Co-authored-by: glide-the <2533736852@qq.com> Co-authored-by: Water Zheng <1499383852@qq.com> Co-authored-by: Jim Zhang <dividi_z@163.com> Co-authored-by: Jim <zhangpengyi@taijihuabao.com> Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com> Co-authored-by: Leego <leegodev@hotmail.com> Co-authored-by: hzg0601 <hzg0601@163.com> Co-authored-by: WilliamChen-luckbob <58684828+WilliamChen-luckbob@users.noreply.github.com> 2023-09-28 23:30:21 +08:00			`from configs import kbs_config`
添加切换模型功能，支持智谱AI在线模型 (#1342) * 添加LLM模型切换功能，需要在server_config中设置可切换的模型 * add tests for api.py/llm_model/* * - 支持模型切换 - 支持智普AI线上模型 - startup.py增加参数`--api-worker`，自动运行所有的线上API模型。使用`-a (--all-webui), --all-api`时默认开启该选项 * 修复被fastchat覆盖的标准输出 * 对fastchat日志进行更细致的控制，startup.py中增加-q(--quiet)开关，可以减少无用的fastchat日志输出 * 修正chatglm api的对话模板 Co-authored-by: liunux4odoo <liunu@qq.com> 2023-09-01 23:58:09 +08:00
适配score_threshold 2023-08-27 11:21:10 +08:00			`from server.knowledge_base.kb_service.base import SupportedVSType, KBService, EmbeddingsFunAdapter, \`
			`score_threshold_process`
update import pkgs and format 2023-08-10 21:26:05 +08:00			`from server.knowledge_base.utils import load_embeddings, KnowledgeFile`
优化LLM和Embedding模型运行设备配置，可设为auto自动检测 2023-08-31 17:33:43 +08:00			`from server.utils import embedding_device as get_embedding_device`
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00
milvus/pg kb_service需要实现get_doc_by_id方法 2023-09-04 16:40:05 +08:00
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00			`class PGKBService(KBService):`
			`pg_vector: PGVector`

优化LLM和Embedding模型运行设备配置，可设为auto自动检测 2023-08-31 17:33:43 +08:00			`def _load_pg_vector(self, embedding_device: str = get_embedding_device(), embeddings: Embeddings = None):`
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00			`_embeddings = embeddings`
			`if _embeddings is None:`
			`_embeddings = load_embeddings(self.embed_model, embedding_device)`
适配score_threshold 2023-08-27 11:21:10 +08:00			`self.pg_vector = PGVector(embedding_function=EmbeddingsFunAdapter(_embeddings),`
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00			`collection_name=self.kb_name,`
适配score_threshold 2023-08-27 11:21:10 +08:00			`distance_strategy=DistanceStrategy.EUCLIDEAN,`
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00			`connection_string=kbs_config.get("pg").get("connection_uri"))`
修复milvus_kb_service中一些bug，添加文档后将数据同步到数据库 (#1452) 2023-09-12 22:34:03 +08:00
升级注意数据库表发生变化，需要重建知识库新功能 - 增加FileDocModel库表，存储知识文件与向量库Document ID对应关系以及元数据，便于检索向量库 - 增加FileDocModel对应的数据库操作函数（这些函数主要是给KBService调用，用户一般无需使用）： - list_docs_from_db: 根据知识库名称、文件名称、元数据检索对应的Document IDs - delete_docs_from_db: 根据知识库名称、文件名称删除对应的file-doc映射 - add_docs_to_db: 添加对应的file-doc映射 - KBService增加list_docs方法，可以根据文件名、元数据检索Document。当前仅支持FAISS，待milvus/pg实现get_doc_by_id方法后即自动支持。 - 去除server.utils对torch的依赖待完善 - milvus/pg kb_service需要实现get_doc_by_id方法 2023-09-01 22:54:57 +08:00			`def get_doc_by_id(self, id: str) -> Optional[Document]:`
milvus/pg kb_service需要实现get_doc_by_id方法 2023-09-04 16:40:05 +08:00			`with self.pg_vector.connect() as connect:`
			`stmt = text("SELECT document, cmetadata FROM langchain_pg_embedding WHERE collection_id=:id")`
			`results = [Document(page_content=row[0], metadata=row[1]) for row in`
			`connect.execute(stmt, parameters={'id': id}).fetchall()]`
			`if len(results) > 0:`
			`return results[0]`
升级注意数据库表发生变化，需要重建知识库新功能 - 增加FileDocModel库表，存储知识文件与向量库Document ID对应关系以及元数据，便于检索向量库 - 增加FileDocModel对应的数据库操作函数（这些函数主要是给KBService调用，用户一般无需使用）： - list_docs_from_db: 根据知识库名称、文件名称、元数据检索对应的Document IDs - delete_docs_from_db: 根据知识库名称、文件名称删除对应的file-doc映射 - add_docs_to_db: 添加对应的file-doc映射 - KBService增加list_docs方法，可以根据文件名、元数据检索Document。当前仅支持FAISS，待milvus/pg实现get_doc_by_id方法后即自动支持。 - 去除server.utils对torch的依赖待完善 - milvus/pg kb_service需要实现get_doc_by_id方法 2023-09-01 22:54:57 +08:00
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00			`def do_init(self):`
			`self._load_pg_vector()`

			`def do_create_kb(self):`
			`pass`

			`def vs_type(self) -> str:`
			`return SupportedVSType.PG`

			`def do_drop_kb(self):`
			`with self.pg_vector.connect() as connect:`
			`connect.execute(text(f'''`
			`-- 删除 langchain_pg_embedding 表中关联到 langchain_pg_collection 表中的记录`
			`DELETE FROM langchain_pg_embedding`
			`WHERE collection_id IN (`
			`SELECT uuid FROM langchain_pg_collection WHERE name = '{self.kb_name}'`
			`);`
			`-- 删除 langchain_pg_collection 表中记录`
			`DELETE FROM langchain_pg_collection WHERE name = '{self.kb_name}';`
			`'''))`
			`connect.commit()`

调整KBService 接口函数do_search 并适配pg 2023-08-24 22:35:30 +08:00			`def do_search(self, query: str, top_k: int, score_threshold: float, embeddings: Embeddings):`
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00			`self._load_pg_vector(embeddings=embeddings)`
适配score_threshold 2023-08-27 11:21:10 +08:00			`return score_threshold_process(score_threshold, top_k,`
			`self.pg_vector.similarity_search_with_score(query, top_k))`
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00
升级注意数据库表发生变化，需要重建知识库新功能 - 增加FileDocModel库表，存储知识文件与向量库Document ID对应关系以及元数据，便于检索向量库 - 增加FileDocModel对应的数据库操作函数（这些函数主要是给KBService调用，用户一般无需使用）： - list_docs_from_db: 根据知识库名称、文件名称、元数据检索对应的Document IDs - delete_docs_from_db: 根据知识库名称、文件名称删除对应的file-doc映射 - add_docs_to_db: 添加对应的file-doc映射 - KBService增加list_docs方法，可以根据文件名、元数据检索Document。当前仅支持FAISS，待milvus/pg实现get_doc_by_id方法后即自动支持。 - 去除server.utils对torch的依赖待完善 - milvus/pg kb_service需要实现get_doc_by_id方法 2023-09-01 22:54:57 +08:00			`def do_add_doc(self, docs: List[Document], **kwargs) -> List[Dict]:`
			`ids = self.pg_vector.add_documents(docs)`
			`doc_infos = [{"id": id, "metadata": doc.metadata} for id, doc in zip(ids, docs)]`
			`return doc_infos`
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00
fix part of #1206: add/delete/update_doc() get unexpected keyword argument 'not_refresh_vs_cache` 2023-08-23 15:26:52 +08:00			`def do_delete_doc(self, kb_file: KnowledgeFile, **kwargs):`
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00			`with self.pg_vector.connect() as connect:`
			`filepath = kb_file.filepath.replace('\\', '\\\\')`
			`connect.execute(`
			`text(`
			`''' DELETE FROM langchain_pg_embedding WHERE cmetadata::jsonb @> '{"source": "filepath"}'::jsonb;'''.replace(`
			`"filepath", filepath)))`
			`connect.commit()`

			`def do_clear_vs(self):`
			`self.pg_vector.delete_collection()`
修复milvus_kb_service中一些bug，添加文档后将数据同步到数据库 (#1452) 2023-09-12 22:34:03 +08:00			`self.pg_vector.create_collection()`
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00

			`if __name__ == '__main__':`
			`from server.db.base import Base, engine`
修复pg和milvus kbservice代码 2023-08-22 16:52:04 +08:00
milvus/pg kb_service需要实现get_doc_by_id方法 2023-09-04 16:40:05 +08:00			`# Base.metadata.create_all(bind=engine)`
添加向量数据库pg支持，和向量库docker-compose.ym环境文件 2023-08-10 11:16:52 +08:00			`pGKBService = PGKBService("test")`
milvus/pg kb_service需要实现get_doc_by_id方法 2023-09-04 16:40:05 +08:00			`# pGKBService.create_kb()`
			`# pGKBService.add_doc(KnowledgeFile("README.md", "test"))`
			`# pGKBService.delete_doc(KnowledgeFile("README.md", "test"))`
			`# pGKBService.drop_kb()`
			`print(pGKBService.get_doc_by_id("f1e51390-3029-4a19-90dc-7118aaa25772"))`
			`# print(pGKBService.search_docs("如何启动api服务"))`