Langchain-Chatchat/server/chat/search_engine_chat.py

from langchain.utilities import BingSearchAPIWrapper, DuckDuckGoSearchAPIWrapper
from configs.model_config import BING_SEARCH_URL, BING_SUBSCRIPTION_KEY
from fastapi import Body
from fastapi.responses import StreamingResponse
from fastapi.concurrency import run_in_threadpool
from configs.model_config import (llm_model_dict, LLM_MODEL, SEARCH_ENGINE_TOP_K,
                                  PROMPT_TEMPLATE, TEMPERATURE)
from server.chat.utils import wrap_done
from server.utils import BaseResponse
from langchain.chat_models import ChatOpenAI
from langchain import LLMChain
from langchain.callbacks import AsyncIteratorCallbackHandler
from typing import AsyncIterable
import asyncio
from langchain.prompts.chat import ChatPromptTemplate
from typing import List, Optional
from server.chat.utils import History
from langchain.docstore.document import Document
import json


def bing_search(text, result_len=SEARCH_ENGINE_TOP_K):
    if not (BING_SEARCH_URL and BING_SUBSCRIPTION_KEY):
        return [{"snippet": "please set BING_SUBSCRIPTION_KEY and BING_SEARCH_URL in os ENV",
                 "title": "env info is not found",
                 "link": "https://python.langchain.com/en/latest/modules/agents/tools/examples/bing_search.html"}]
    search = BingSearchAPIWrapper(bing_subscription_key=BING_SUBSCRIPTION_KEY,
                                  bing_search_url=BING_SEARCH_URL)
    return search.results(text, result_len)


def duckduckgo_search(text, result_len=SEARCH_ENGINE_TOP_K):
    search = DuckDuckGoSearchAPIWrapper()
    return search.results(text, result_len)


SEARCH_ENGINES = {"bing": bing_search,
                  "duckduckgo": duckduckgo_search,
                  }


def search_result2docs(search_results):
    docs = []
    for result in search_results:
        doc = Document(page_content=result["snippet"] if "snippet" in result.keys() else "",
                       metadata={"source": result["link"] if "link" in result.keys() else "",
                                 "filename": result["title"] if "title" in result.keys() else ""})
        docs.append(doc)
    return docs


async def lookup_search_engine(
        query: str,
        search_engine_name: str,
        top_k: int = SEARCH_ENGINE_TOP_K,
):
    search_engine = SEARCH_ENGINES[search_engine_name]
    results = await run_in_threadpool(search_engine, query, result_len=top_k)
    docs = search_result2docs(results)
    return docs


async def search_engine_chat(query: str = Body(..., description="用户输入", examples=["你好"]),
                            search_engine_name: str = Body(..., description="搜索引擎名称", examples=["duckduckgo"]),
                            top_k: int = Body(SEARCH_ENGINE_TOP_K, description="检索结果数量"),
                            history: List[History] = Body([],
                                                            description="历史对话",
                                                            examples=[[
                                                                {"role": "user",
                                                                "content": "我们来玩成语接龙，我先来，生龙活虎"},
                                                                {"role": "assistant",
                                                                "content": "虎头虎脑"}]]
                                                            ),
                            stream: bool = Body(False, description="流式输出"),
                            model_name: str = Body(LLM_MODEL, description="LLM 模型名称。"),
                            temperature: float = Body(TEMPERATURE, description="LLM 采样温度", gt=0.0, le=1.0),
                       ):
    if search_engine_name not in SEARCH_ENGINES.keys():
        return BaseResponse(code=404, msg=f"未支持搜索引擎 {search_engine_name}")

    if search_engine_name == "bing" and not BING_SUBSCRIPTION_KEY:
        return BaseResponse(code=404, msg=f"要使用Bing搜索引擎，需要设置 `BING_SUBSCRIPTION_KEY`")

    history = [History.from_data(h) for h in history]

    async def search_engine_chat_iterator(query: str,
                                          search_engine_name: str,
                                          top_k: int,
                                          history: Optional[List[History]],
                                          model_name: str = LLM_MODEL,
                                          ) -> AsyncIterable[str]:
        callback = AsyncIteratorCallbackHandler()
        model = ChatOpenAI(
            streaming=True,
            verbose=True,
            callbacks=[callback],
            openai_api_key=llm_model_dict[model_name]["api_key"],
            openai_api_base=llm_model_dict[model_name]["api_base_url"],
            model_name=model_name,
            temperature=temperature,
            openai_proxy=llm_model_dict[model_name].get("openai_proxy")
        )

        docs = await lookup_search_engine(query, search_engine_name, top_k)
        context = "\n".join([doc.page_content for doc in docs])

        input_msg = History(role="user", content=PROMPT_TEMPLATE).to_msg_template(False)
        chat_prompt = ChatPromptTemplate.from_messages(
            [i.to_msg_template() for i in history] + [input_msg])

        chain = LLMChain(prompt=chat_prompt, llm=model)

        # Begin a task that runs in the background.
        task = asyncio.create_task(wrap_done(
            chain.acall({"context": context, "question": query}),
            callback.done),
        )

        source_documents = [
            f"""出处 [{inum + 1}] [{doc.metadata["source"]}]({doc.metadata["source"]}) \n\n{doc.page_content}\n\n"""
            for inum, doc in enumerate(docs)
        ]

        if stream:
            async for token in callback.aiter():
                # Use server-sent-events to stream the response
                yield json.dumps({"answer": token}, ensure_ascii=False)
            yield json.dumps({"docs": source_documents}, ensure_ascii=False)
        else:
            answer = ""
            async for token in callback.aiter():
                answer += token
            yield json.dumps({"answer": answer,
                              "docs": source_documents},
                             ensure_ascii=False)
        await task

    return StreamingResponse(search_engine_chat_iterator(query, search_engine_name, top_k, history, model_name),
                             media_type="text/event-stream")
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								from langchain.utilities import BingSearchAPIWrapper, DuckDuckGoSearchAPIWrapper
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								from configs.model_config import BING_SEARCH_URL, BING_SUBSCRIPTION_KEY
 								from fastapi import Body
 								from fastapi.responses import StreamingResponse
-												改变api视图函数的sync/async，提高api并发能力： (#1414)

1. 4个chat类接口改为async
2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发
											
										
										
											2023-09-08 12:25:02 +08:00
+								from fastapi.concurrency import run_in_threadpool
-												对话接口支持temperature参数 (#1455)


											
										
										
											2023-09-13 10:00:54 +08:00
+								from configs.model_config import (llm_model_dict, LLM_MODEL, SEARCH_ENGINE_TOP_K,
 								                                  PROMPT_TEMPLATE, TEMPERATURE)
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								from server.chat.utils import wrap_done
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								from server.utils import BaseResponse
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								from langchain.chat_models import ChatOpenAI
 								from langchain import LLMChain
 								from langchain.callbacks import AsyncIteratorCallbackHandler
 								from typing import AsyncIterable
 								import asyncio
-												add history to chat apis

											
										
										
											2023-08-08 23:54:51 +08:00
+								from langchain.prompts.chat import ChatPromptTemplate
 								from typing import List, Optional
 								from server.chat.utils import History
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								from langchain.docstore.document import Document
-												fix: knowledge_base_chat and search_engine_chat should stream json text
instead of dict. client should use json.loads.

											
										
										
											2023-08-04 12:12:13 +08:00
+								import json
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
-												add top-k to search_chat apis and add top-k params in model_config

											
										
										
											2023-08-03 17:06:43 +08:00
+								def bing_search(text, result_len=SEARCH_ENGINE_TOP_K):
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								    if not (BING_SEARCH_URL and BING_SUBSCRIPTION_KEY):
 								        return [{"snippet": "please set BING_SUBSCRIPTION_KEY and BING_SEARCH_URL in os ENV",
 								                 "title": "env info is not found",
 								                 "link": "https://python.langchain.com/en/latest/modules/agents/tools/examples/bing_search.html"}]
 								    search = BingSearchAPIWrapper(bing_subscription_key=BING_SUBSCRIPTION_KEY,
 								                                  bing_search_url=BING_SEARCH_URL)
 								    return search.results(text, result_len)
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								def duckduckgo_search(text, result_len=SEARCH_ENGINE_TOP_K):
 								    search = DuckDuckGoSearchAPIWrapper()
 								    return search.results(text, result_len)
 								SEARCH_ENGINES = {"bing": bing_search,
 								                  "duckduckgo": duckduckgo_search,
 								                  }
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								def search_result2docs(search_results):
 								    docs = []
 								    for result in search_results:
 								        doc = Document(page_content=result["snippet"] if "snippet" in result.keys() else "",
 								                       metadata={"source": result["link"] if "link" in result.keys() else "",
 								                                 "filename": result["title"] if "title" in result.keys() else ""})
 								        docs.append(doc)
 								    return docs
-												改变api视图函数的sync/async，提高api并发能力： (#1414)

1. 4个chat类接口改为async
2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发
											
										
										
											2023-09-08 12:25:02 +08:00
+								async def lookup_search_engine(
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								        query: str,
 								        search_engine_name: str,
 								        top_k: int = SEARCH_ENGINE_TOP_K,
 								):
-												改变api视图函数的sync/async，提高api并发能力： (#1414)

1. 4个chat类接口改为async
2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发
											
										
										
											2023-09-08 12:25:02 +08:00
+								    search_engine = SEARCH_ENGINES[search_engine_name]
 								    results = await run_in_threadpool(search_engine, query, result_len=top_k)
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								    docs = search_result2docs(results)
 								    return docs
-												改变api视图函数的sync/async，提高api并发能力： (#1414)

1. 4个chat类接口改为async
2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发
											
										
										
											2023-09-08 12:25:02 +08:00
+								async def search_engine_chat(query: str = Body(..., description="用户输入", examples=["你好"]),
 								                            search_engine_name: str = Body(..., description="搜索引擎名称", examples=["duckduckgo"]),
 								                            top_k: int = Body(SEARCH_ENGINE_TOP_K, description="检索结果数量"),
 								                            history: List[History] = Body([],
 								                                                            description="历史对话",
 								                                                            examples=[[
 								                                                                {"role": "user",
 								                                                                "content": "我们来玩成语接龙，我先来，生龙活虎"},
 								                                                                {"role": "assistant",
 								                                                                "content": "虎头虎脑"}]]
 								                                                            ),
 								                            stream: bool = Body(False, description="流式输出"),
 								                            model_name: str = Body(LLM_MODEL, description="LLM 模型名称。"),
-												对话接口支持temperature参数 (#1455)


											
										
										
											2023-09-13 10:00:54 +08:00
+								                            temperature: float = Body(TEMPERATURE, description="LLM 采样温度", gt=0.0, le=1.0),
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								                       ):
 								    if search_engine_name not in SEARCH_ENGINES.keys():
 								        return BaseResponse(code=404, msg=f"未支持搜索引擎 {search_engine_name}")
-												在search_engine_chat中检查Bing KEY，并更新tests

											
										
										
											2023-08-25 10:58:40 +08:00
+								    if search_engine_name == "bing" and not BING_SUBSCRIPTION_KEY:
 								        return BaseResponse(code=404, msg=f"要使用Bing搜索引擎，需要设置 `BING_SUBSCRIPTION_KEY`")
-												fix #1142: 在History中使用jinja2模板代替f-string，避免消息中含有{ }时出错

											
										
										
											2023-08-23 08:35:26 +08:00
+								    history = [History.from_data(h) for h in history]
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								    async def search_engine_chat_iterator(query: str,
 								                                          search_engine_name: str,
 								                                          top_k: int,
-												add history to chat apis

											
										
										
											2023-08-08 23:54:51 +08:00
+								                                          history: Optional[List[History]],
-												添加切换模型功能，支持智谱AI在线模型 (#1342)

* 添加LLM模型切换功能，需要在server_config中设置可切换的模型
* add tests for api.py/llm_model/*
* - 支持模型切换
- 支持智普AI线上模型
- startup.py增加参数`--api-worker`，自动运行所有的线上API模型。使用`-a
  (--all-webui), --all-api`时默认开启该选项
* 修复被fastchat覆盖的标准输出
* 对fastchat日志进行更细致的控制，startup.py中增加-q(--quiet)开关，可以减少无用的fastchat日志输出
* 修正chatglm api的对话模板


Co-authored-by: liunux4odoo <liunu@qq.com>
											
										
										
											2023-09-01 23:58:09 +08:00
+								                                          model_name: str = LLM_MODEL,
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								                                          ) -> AsyncIterable[str]:
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								        callback = AsyncIteratorCallbackHandler()
 								        model = ChatOpenAI(
 								            streaming=True,
 								            verbose=True,
 								            callbacks=[callback],
-												添加切换模型功能，支持智谱AI在线模型 (#1342)

* 添加LLM模型切换功能，需要在server_config中设置可切换的模型
* add tests for api.py/llm_model/*
* - 支持模型切换
- 支持智普AI线上模型
- startup.py增加参数`--api-worker`，自动运行所有的线上API模型。使用`-a
  (--all-webui), --all-api`时默认开启该选项
* 修复被fastchat覆盖的标准输出
* 对fastchat日志进行更细致的控制，startup.py中增加-q(--quiet)开关，可以减少无用的fastchat日志输出
* 修正chatglm api的对话模板


Co-authored-by: liunux4odoo <liunu@qq.com>
											
										
										
											2023-09-01 23:58:09 +08:00
+								            openai_api_key=llm_model_dict[model_name]["api_key"],
 								            openai_api_base=llm_model_dict[model_name]["api_base_url"],
 								            model_name=model_name,
-												对话接口支持temperature参数 (#1455)


											
										
										
											2023-09-13 10:00:54 +08:00
+								            temperature=temperature,
-												添加切换模型功能，支持智谱AI在线模型 (#1342)

* 添加LLM模型切换功能，需要在server_config中设置可切换的模型
* add tests for api.py/llm_model/*
* - 支持模型切换
- 支持智普AI线上模型
- startup.py增加参数`--api-worker`，自动运行所有的线上API模型。使用`-a
  (--all-webui), --all-api`时默认开启该选项
* 修复被fastchat覆盖的标准输出
* 对fastchat日志进行更细致的控制，startup.py中增加-q(--quiet)开关，可以减少无用的fastchat日志输出
* 修正chatglm api的对话模板


Co-authored-by: liunux4odoo <liunu@qq.com>
											
										
										
											2023-09-01 23:58:09 +08:00
+								            openai_proxy=llm_model_dict[model_name].get("openai_proxy")
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								        )
-												改变api视图函数的sync/async，提高api并发能力： (#1414)

1. 4个chat类接口改为async
2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发
											
										
										
											2023-09-08 12:25:02 +08:00
+								        docs = await lookup_search_engine(query, search_engine_name, top_k)
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								        context = "\n".join([doc.page_content for doc in docs])
-												fix #1142: 在History中使用jinja2模板代替f-string，避免消息中含有{ }时出错

											
										
										
											2023-08-23 08:35:26 +08:00
+								        input_msg = History(role="user", content=PROMPT_TEMPLATE).to_msg_template(False)
-												add history to chat apis

											
										
										
											2023-08-08 23:54:51 +08:00
+								        chat_prompt = ChatPromptTemplate.from_messages(
-												fix #1142: 在History中使用jinja2模板代替f-string，避免消息中含有{ }时出错

											
										
										
											2023-08-23 08:35:26 +08:00
+								            [i.to_msg_template() for i in history] + [input_msg])
-												add history to chat apis

											
										
										
											2023-08-08 23:54:51 +08:00
 								        chain = LLMChain(prompt=chat_prompt, llm=model)
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
 								        # Begin a task that runs in the background.
 								        task = asyncio.create_task(wrap_done(
 								            chain.acall({"context": context, "question": query}),
 								            callback.done),
 								        )
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								        source_documents = [
 								            f"""出处 [{inum + 1}] [{doc.metadata["source"]}]({doc.metadata["source"]}) \n\n{doc.page_content}\n\n"""
 								            for inum, doc in enumerate(docs)
 								        ]
-												update kb and search chat: disable streaming in swagger besides streaming in ApiRequest

											
										
										
											2023-08-09 23:35:36 +08:00
+								        if stream:
 								            async for token in callback.aiter():
 								                # Use server-sent-events to stream the response
-												fix api and webui: (#1435)

1. fix #1431: 优化知识库问答与搜索引擎问答的API接口，避免docs重复返回
2. startup.py根据configs.log_verbose控制log级别
3. 修复/llm_model/list_models的bug:
   只有一个参数时，fastapi未返回json导致视图函数出错
											
										
										
											2023-09-12 08:31:17 +08:00
+								                yield json.dumps({"answer": token}, ensure_ascii=False)
 								            yield json.dumps({"docs": source_documents}, ensure_ascii=False)
-												update kb and search chat: disable streaming in swagger besides streaming in ApiRequest

											
										
										
											2023-08-09 23:35:36 +08:00
+								        else:
 								            answer = ""
 								            async for token in callback.aiter():
 								                answer += token
-												search_engine_chat bug

											
										
										
											2023-08-24 17:25:54 +08:00
+								            yield json.dumps({"answer": answer,
-												update faiss_kb_service.py

											
										
										
											2023-08-09 22:57:36 +08:00
+								                              "docs": source_documents},
 								                             ensure_ascii=False)
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								        await task
-												添加切换模型功能，支持智谱AI在线模型 (#1342)

* 添加LLM模型切换功能，需要在server_config中设置可切换的模型
* add tests for api.py/llm_model/*
* - 支持模型切换
- 支持智普AI线上模型
- startup.py增加参数`--api-worker`，自动运行所有的线上API模型。使用`-a
  (--all-webui), --all-api`时默认开启该选项
* 修复被fastchat覆盖的标准输出
* 对fastchat日志进行更细致的控制，startup.py中增加-q(--quiet)开关，可以减少无用的fastchat日志输出
* 修正chatglm api的对话模板


Co-authored-by: liunux4odoo <liunu@qq.com>
											
										
										
											2023-09-01 23:58:09 +08:00
+								    return StreamingResponse(search_engine_chat_iterator(query, search_engine_name, top_k, history, model_name),
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								                             media_type="text/event-stream")