Langchain-Chatchat/server/chat/search_engine_chat.py

from langchain.utilities.bing_search import BingSearchAPIWrapper
from langchain.utilities.duckduckgo_search import DuckDuckGoSearchAPIWrapper
from configs import (BING_SEARCH_URL, BING_SUBSCRIPTION_KEY, METAPHOR_API_KEY,
                     LLM_MODELS, SEARCH_ENGINE_TOP_K, TEMPERATURE,
                     TEXT_SPLITTER_NAME, OVERLAP_SIZE)
from fastapi import Body
from fastapi.responses import StreamingResponse
from fastapi.concurrency import run_in_threadpool
from server.utils import wrap_done, get_ChatOpenAI
from server.utils import BaseResponse, get_prompt_template
from langchain.chains import LLMChain
from langchain.callbacks import AsyncIteratorCallbackHandler
from typing import AsyncIterable
import asyncio
from langchain.prompts.chat import ChatPromptTemplate
from langchain.text_splitter import RecursiveCharacterTextSplitter
from typing import List, Optional, Dict
from server.chat.utils import History
from langchain.docstore.document import Document
import json
from strsimpy.normalized_levenshtein import NormalizedLevenshtein
from markdownify import markdownify


def bing_search(text, result_len=SEARCH_ENGINE_TOP_K, **kwargs):
    if not (BING_SEARCH_URL and BING_SUBSCRIPTION_KEY):
        return [{"snippet": "please set BING_SUBSCRIPTION_KEY and BING_SEARCH_URL in os ENV",
                 "title": "env info is not found",
                 "link": "https://python.langchain.com/en/latest/modules/agents/tools/examples/bing_search.html"}]
    search = BingSearchAPIWrapper(bing_subscription_key=BING_SUBSCRIPTION_KEY,
                                  bing_search_url=BING_SEARCH_URL)
    return search.results(text, result_len)


def duckduckgo_search(text, result_len=SEARCH_ENGINE_TOP_K, **kwargs):
    search = DuckDuckGoSearchAPIWrapper()
    return search.results(text, result_len)


def metaphor_search(
    text: str,
    result_len: int = SEARCH_ENGINE_TOP_K,
    split_result: bool = False,
    chunk_size: int = 500,
    chunk_overlap: int = OVERLAP_SIZE,
) -> List[Dict]:
    from metaphor_python import Metaphor

    if not METAPHOR_API_KEY:
        return []

    client = Metaphor(METAPHOR_API_KEY)
    search = client.search(text, num_results=result_len, use_autoprompt=True)
    contents = search.get_contents().contents
    for x in contents:
        x.extract = markdownify(x.extract)

    # metaphor 返回的内容都是长文本，需要分词再检索
    if split_result:
        docs = [Document(page_content=x.extract,
                        metadata={"link": x.url, "title": x.title})
                for x in contents]
        text_splitter = RecursiveCharacterTextSplitter(["\n\n", "\n", ".", " "],
                                                       chunk_size=chunk_size,
                                                       chunk_overlap=chunk_overlap)
        splitted_docs = text_splitter.split_documents(docs)
        
        # 将切分好的文档放入临时向量库，重新筛选出TOP_K个文档
        if len(splitted_docs) > result_len:
            normal = NormalizedLevenshtein()
            for x in splitted_docs:
                x.metadata["score"] = normal.similarity(text, x.page_content)
            splitted_docs.sort(key=lambda x: x.metadata["score"], reverse=True)
            splitted_docs = splitted_docs[:result_len]

        docs = [{"snippet": x.page_content,
                "link": x.metadata["link"],
                "title": x.metadata["title"]}
                for x in splitted_docs]
    else:
        docs = [{"snippet": x.extract,
                "link": x.url,
                "title": x.title}
                for x in contents]

    return docs


SEARCH_ENGINES = {"bing": bing_search,
                  "duckduckgo": duckduckgo_search,
                  "metaphor": metaphor_search,
                  }


def search_result2docs(search_results):
    docs = []
    for result in search_results:
        doc = Document(page_content=result["snippet"] if "snippet" in result.keys() else "",
                       metadata={"source": result["link"] if "link" in result.keys() else "",
                                 "filename": result["title"] if "title" in result.keys() else ""})
        docs.append(doc)
    return docs


async def lookup_search_engine(
        query: str,
        search_engine_name: str,
        top_k: int = SEARCH_ENGINE_TOP_K,
        split_result: bool = False,
):
    search_engine = SEARCH_ENGINES[search_engine_name]
    results = await run_in_threadpool(search_engine, query, result_len=top_k, split_result=split_result)
    docs = search_result2docs(results)
    return docs


async def search_engine_chat(query: str = Body(..., description="用户输入", examples=["你好"]),
                            search_engine_name: str = Body(..., description="搜索引擎名称", examples=["duckduckgo"]),
                            top_k: int = Body(SEARCH_ENGINE_TOP_K, description="检索结果数量"),
                            history: List[History] = Body([],
                                                            description="历史对话",
                                                            examples=[[
                                                                {"role": "user",
                                                                "content": "我们来玩成语接龙，我先来，生龙活虎"},
                                                                {"role": "assistant",
                                                                "content": "虎头虎脑"}]]
                                                            ),
                            stream: bool = Body(False, description="流式输出"),
                            model_name: str = Body(LLM_MODELS[0], description="LLM 模型名称。"),
                            temperature: float = Body(TEMPERATURE, description="LLM 采样温度", ge=0.0, le=1.0),
                            max_tokens: Optional[int] = Body(None, description="限制LLM生成Token数量，默认None代表模型最大值"),
                            prompt_name: str = Body("default",description="使用的prompt模板名称(在configs/prompt_config.py中配置)"),
                            split_result: bool = Body(False, description="是否对搜索结果进行拆分（主要用于metaphor搜索引擎）")
                       ):
    if search_engine_name not in SEARCH_ENGINES.keys():
        return BaseResponse(code=404, msg=f"未支持搜索引擎 {search_engine_name}")

    if search_engine_name == "bing" and not BING_SUBSCRIPTION_KEY:
        return BaseResponse(code=404, msg=f"要使用Bing搜索引擎，需要设置 `BING_SUBSCRIPTION_KEY`")

    history = [History.from_data(h) for h in history]

    async def search_engine_chat_iterator(query: str,
                                          search_engine_name: str,
                                          top_k: int,
                                          history: Optional[List[History]],
                                          model_name: str = LLM_MODELS[0],
                                          prompt_name: str = prompt_name,
                                          ) -> AsyncIterable[str]:
        callback = AsyncIteratorCallbackHandler()
        if isinstance(max_tokens, int) and max_tokens <= 0:
            max_tokens = None

        model = get_ChatOpenAI(
            model_name=model_name,
            temperature=temperature,
            max_tokens=max_tokens,
            callbacks=[callback],
        )

        docs = await lookup_search_engine(query, search_engine_name, top_k, split_result=split_result)
        context = "\n".join([doc.page_content for doc in docs])

        prompt_template = get_prompt_template("search_engine_chat", prompt_name)
        input_msg = History(role="user", content=prompt_template).to_msg_template(False)
        chat_prompt = ChatPromptTemplate.from_messages(
            [i.to_msg_template() for i in history] + [input_msg])

        chain = LLMChain(prompt=chat_prompt, llm=model)

        # Begin a task that runs in the background.
        task = asyncio.create_task(wrap_done(
            chain.acall({"context": context, "question": query}),
            callback.done),
        )

        source_documents = [
            f"""出处 [{inum + 1}] [{doc.metadata["source"]}]({doc.metadata["source"]}) \n\n{doc.page_content}\n\n"""
            for inum, doc in enumerate(docs)
        ]

        if len(source_documents) == 0:  # 没有找到相关资料（不太可能）
            source_documents.append(f"""<span style='color:red'>未找到相关文档,该回答为大模型自身能力解答！</span>""")

        if stream:
            async for token in callback.aiter():
                # Use server-sent-events to stream the response
                yield json.dumps({"answer": token}, ensure_ascii=False)
            yield json.dumps({"docs": source_documents}, ensure_ascii=False)
        else:
            answer = ""
            async for token in callback.aiter():
                answer += token
            yield json.dumps({"answer": answer,
                              "docs": source_documents},
                             ensure_ascii=False)
        await task

    return StreamingResponse(search_engine_chat_iterator(query=query,
                                                         search_engine_name=search_engine_name,
                                                         top_k=top_k,
                                                         history=history,
                                                         model_name=model_name,
                                                         prompt_name=prompt_name),
                             media_type="text/event-stream")
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
+								from langchain.utilities.bing_search import BingSearchAPIWrapper
 								from langchain.utilities.duckduckgo_search import DuckDuckGoSearchAPIWrapper
-												- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文）
- 增加默认知识库和默认搜索引擎的配置项
- 修复WEBUI弹出当前模型错误

											
										
										
											2023-10-18 23:02:20 +08:00
+								from configs import (BING_SEARCH_URL, BING_SUBSCRIPTION_KEY, METAPHOR_API_KEY,
-												支持通过配置项同时启动多个模型，将Wiki纳入samples知识库 (#2002)

新功能：
- 将 LLM_MODEL 配置项改为 LLM_MODELS 列表，同时启动多个模型
- 将 wiki 纳入 samples 知识库

依赖变化：
- 指定 streamlit~=1.27.0。1.26.0会报rerun错误，1.28.0会有无限刷新错误

修复优化：
- 优化 get_default_llm_model 逻辑
- 适配 Qwen 在线 API 做 Embeddings 时最大 25 行的限制
- 列出知识库磁盘文件时跳过 . 开头的文件
											
										
										
											2023-11-09 22:15:52 +08:00
+								                     LLM_MODELS, SEARCH_ENGINE_TOP_K, TEMPERATURE,
-												- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文）
- 增加默认知识库和默认搜索引擎的配置项
- 修复WEBUI弹出当前模型错误

											
										
										
											2023-10-18 23:02:20 +08:00
+								                     TEXT_SPLITTER_NAME, OVERLAP_SIZE)
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								from fastapi import Body
 								from fastapi.responses import StreamingResponse
-												改变api视图函数的sync/async，提高api并发能力： (#1414)

1. 4个chat类接口改为async
2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发
											
										
										
											2023-09-08 12:25:02 +08:00
+								from fastapi.concurrency import run_in_threadpool
-												move wrap_done & get_ChatOpenAI from server.chat.utils to server.utils (#1506)


											
										
										
											2023-09-17 16:19:50 +08:00
+								from server.utils import wrap_done, get_ChatOpenAI
-												添加configs/prompt_config.py，允许用户自定义prompt模板： (#1504)

1、 默认包含2个模板，分别用于LLM对话，知识库和搜索引擎对话
2、 server/utils.py提供函数get_prompt_template，获取指定的prompt模板内容（支持热加载）
3、 api.py中chat/knowledge_base_chat/search_engine_chat接口支持prompt_name参数
											
										
										
											2023-09-17 13:27:11 +08:00
+								from server.utils import BaseResponse, get_prompt_template
-												fix: langchain warnings for import from root

											
										
										
											2023-09-27 21:53:47 +08:00
+								from langchain.chains import LLMChain
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								from langchain.callbacks import AsyncIteratorCallbackHandler
 								from typing import AsyncIterable
 								import asyncio
-												add history to chat apis

											
										
										
											2023-08-08 23:54:51 +08:00
+								from langchain.prompts.chat import ChatPromptTemplate
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
+								from langchain.text_splitter import RecursiveCharacterTextSplitter
-												- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文）
- 增加默认知识库和默认搜索引擎的配置项
- 修复WEBUI弹出当前模型错误

											
										
										
											2023-10-18 23:02:20 +08:00
+								from typing import List, Optional, Dict
-												add history to chat apis

											
										
										
											2023-08-08 23:54:51 +08:00
+								from server.chat.utils import History
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								from langchain.docstore.document import Document
-												fix: knowledge_base_chat and search_engine_chat should stream json text
instead of dict. client should use json.loads.

											
										
										
											2023-08-04 12:12:13 +08:00
+								import json
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
+								from strsimpy.normalized_levenshtein import NormalizedLevenshtein
 								from markdownify import markdownify
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
+								def bing_search(text, result_len=SEARCH_ENGINE_TOP_K, **kwargs):
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								    if not (BING_SEARCH_URL and BING_SUBSCRIPTION_KEY):
 								        return [{"snippet": "please set BING_SUBSCRIPTION_KEY and BING_SEARCH_URL in os ENV",
 								                 "title": "env info is not found",
 								                 "link": "https://python.langchain.com/en/latest/modules/agents/tools/examples/bing_search.html"}]
 								    search = BingSearchAPIWrapper(bing_subscription_key=BING_SUBSCRIPTION_KEY,
 								                                  bing_search_url=BING_SEARCH_URL)
 								    return search.results(text, result_len)
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
+								def duckduckgo_search(text, result_len=SEARCH_ENGINE_TOP_K, **kwargs):
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								    search = DuckDuckGoSearchAPIWrapper()
 								    return search.results(text, result_len)
-												- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文）
- 增加默认知识库和默认搜索引擎的配置项
- 修复WEBUI弹出当前模型错误

											
										
										
											2023-10-18 23:02:20 +08:00
+								def metaphor_search(
 								    text: str,
 								    result_len: int = SEARCH_ENGINE_TOP_K,
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
+								    split_result: bool = False,
-												- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文）
- 增加默认知识库和默认搜索引擎的配置项
- 修复WEBUI弹出当前模型错误

											
										
										
											2023-10-18 23:02:20 +08:00
+								    chunk_size: int = 500,
 								    chunk_overlap: int = OVERLAP_SIZE,
 								) -> List[Dict]:
 								    from metaphor_python import Metaphor
 								    if not METAPHOR_API_KEY:
 								        return []
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
-												- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文）
- 增加默认知识库和默认搜索引擎的配置项
- 修复WEBUI弹出当前模型错误

											
										
										
											2023-10-18 23:02:20 +08:00
+								    client = Metaphor(METAPHOR_API_KEY)
 								    search = client.search(text, num_results=result_len, use_autoprompt=True)
 								    contents = search.get_contents().contents
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
+								    for x in contents:
 								        x.extract = markdownify(x.extract)
-												- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文）
- 增加默认知识库和默认搜索引擎的配置项
- 修复WEBUI弹出当前模型错误

											
										
										
											2023-10-18 23:02:20 +08:00
 								    # metaphor 返回的内容都是长文本，需要分词再检索
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
+								    if split_result:
 								        docs = [Document(page_content=x.extract,
 								                        metadata={"link": x.url, "title": x.title})
 								                for x in contents]
 								        text_splitter = RecursiveCharacterTextSplitter(["\n\n", "\n", ".", " "],
 								                                                       chunk_size=chunk_size,
 								                                                       chunk_overlap=chunk_overlap)
 								        splitted_docs = text_splitter.split_documents(docs)
 								        # 将切分好的文档放入临时向量库，重新筛选出TOP_K个文档
 								        if len(splitted_docs) > result_len:
 								            normal = NormalizedLevenshtein()
 								            for x in splitted_docs:
 								                x.metadata["score"] = normal.similarity(text, x.page_content)
 								            splitted_docs.sort(key=lambda x: x.metadata["score"], reverse=True)
 								            splitted_docs = splitted_docs[:result_len]
 								        docs = [{"snippet": x.page_content,
 								                "link": x.metadata["link"],
 								                "title": x.metadata["title"]}
 								                for x in splitted_docs]
 								    else:
 								        docs = [{"snippet": x.extract,
 								                "link": x.url,
 								                "title": x.title}
 								                for x in contents]
-												- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文）
- 增加默认知识库和默认搜索引擎的配置项
- 修复WEBUI弹出当前模型错误

											
										
										
											2023-10-18 23:02:20 +08:00
+								    return docs
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								SEARCH_ENGINES = {"bing": bing_search,
 								                  "duckduckgo": duckduckgo_search,
-												- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文）
- 增加默认知识库和默认搜索引擎的配置项
- 修复WEBUI弹出当前模型错误

											
										
										
											2023-10-18 23:02:20 +08:00
+								                  "metaphor": metaphor_search,
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								                  }
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								def search_result2docs(search_results):
 								    docs = []
 								    for result in search_results:
 								        doc = Document(page_content=result["snippet"] if "snippet" in result.keys() else "",
 								                       metadata={"source": result["link"] if "link" in result.keys() else "",
 								                                 "filename": result["title"] if "title" in result.keys() else ""})
 								        docs.append(doc)
 								    return docs
-												改变api视图函数的sync/async，提高api并发能力： (#1414)

1. 4个chat类接口改为async
2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发
											
										
										
											2023-09-08 12:25:02 +08:00
+								async def lookup_search_engine(
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								        query: str,
 								        search_engine_name: str,
 								        top_k: int = SEARCH_ENGINE_TOP_K,
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
+								        split_result: bool = False,
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								):
-												改变api视图函数的sync/async，提高api并发能力： (#1414)

1. 4个chat类接口改为async
2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发
											
										
										
											2023-09-08 12:25:02 +08:00
+								    search_engine = SEARCH_ENGINES[search_engine_name]
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
+								    results = await run_in_threadpool(search_engine, query, result_len=top_k, split_result=split_result)
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								    docs = search_result2docs(results)
 								    return docs
-												改变api视图函数的sync/async，提高api并发能力： (#1414)

1. 4个chat类接口改为async
2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发
											
										
										
											2023-09-08 12:25:02 +08:00
+								async def search_engine_chat(query: str = Body(..., description="用户输入", examples=["你好"]),
 								                            search_engine_name: str = Body(..., description="搜索引擎名称", examples=["duckduckgo"]),
 								                            top_k: int = Body(SEARCH_ENGINE_TOP_K, description="检索结果数量"),
 								                            history: List[History] = Body([],
 								                                                            description="历史对话",
 								                                                            examples=[[
 								                                                                {"role": "user",
 								                                                                "content": "我们来玩成语接龙，我先来，生龙活虎"},
 								                                                                {"role": "assistant",
 								                                                                "content": "虎头虎脑"}]]
 								                                                            ),
 								                            stream: bool = Body(False, description="流式输出"),
-												支持通过配置项同时启动多个模型，将Wiki纳入samples知识库 (#2002)

新功能：
- 将 LLM_MODEL 配置项改为 LLM_MODELS 列表，同时启动多个模型
- 将 wiki 纳入 samples 知识库

依赖变化：
- 指定 streamlit~=1.27.0。1.26.0会报rerun错误，1.28.0会有无限刷新错误

修复优化：
- 优化 get_default_llm_model 逻辑
- 适配 Qwen 在线 API 做 Embeddings 时最大 25 行的限制
- 列出知识库磁盘文件时跳过 . 开头的文件
											
										
										
											2023-11-09 22:15:52 +08:00
+								                            model_name: str = Body(LLM_MODELS[0], description="LLM 模型名称。"),
-												Dev (#1613)

* 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写

* issue提到的一个bug

* 温度最小改成0，但是不应该支持负数

* 修改了最小的温度
											
										
										
											2023-09-27 21:17:50 +08:00
+								                            temperature: float = Body(TEMPERATURE, description="LLM 采样温度", ge=0.0, le=1.0),
-												优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式 (#1886)

* 优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式

新功能
- 智谱AI、Minimax、千帆、千问 4 个在线模型支持 embeddings（不通过Fastchat，后续会单独提供相关api接口）
- 在线模型自动检测传入参数，在传入非 messages 格式的 prompt 时，自动转换为 completion 形式，以支持 completion 接口

开发者：
- 重构ApiModelWorker:
  - 所有在线 API 请求封装到 do_chat 方法：自动传入参数 ApiChatParams，简化参数与配置项的获取；自动处理与fastchat的接口
  - 加强 API 请求错误处理，返回更有意义的信息
  - 改用 qianfan sdk 重写 qianfan-api
  - 将所有在线模型的测试用例统一在一起，简化测试用例编写

* Delete requirements_langflow.txt
											
										
										
											2023-10-26 22:44:48 +08:00
+								                            max_tokens: Optional[int] = Body(None, description="限制LLM生成Token数量，默认None代表模型最大值"),
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								                            prompt_name: str = Body("default",description="使用的prompt模板名称(在configs/prompt_config.py中配置)"),
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
+								                            split_result: bool = Body(False, description="是否对搜索结果进行拆分（主要用于metaphor搜索引擎）")
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								                       ):
 								    if search_engine_name not in SEARCH_ENGINES.keys():
 								        return BaseResponse(code=404, msg=f"未支持搜索引擎 {search_engine_name}")
-												在search_engine_chat中检查Bing KEY，并更新tests

											
										
										
											2023-08-25 10:58:40 +08:00
+								    if search_engine_name == "bing" and not BING_SUBSCRIPTION_KEY:
 								        return BaseResponse(code=404, msg=f"要使用Bing搜索引擎，需要设置 `BING_SUBSCRIPTION_KEY`")
-												fix #1142: 在History中使用jinja2模板代替f-string，避免消息中含有{ }时出错

											
										
										
											2023-08-23 08:35:26 +08:00
+								    history = [History.from_data(h) for h in history]
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								    async def search_engine_chat_iterator(query: str,
 								                                          search_engine_name: str,
 								                                          top_k: int,
-												add history to chat apis

											
										
										
											2023-08-08 23:54:51 +08:00
+								                                          history: Optional[List[History]],
-												支持通过配置项同时启动多个模型，将Wiki纳入samples知识库 (#2002)

新功能：
- 将 LLM_MODEL 配置项改为 LLM_MODELS 列表，同时启动多个模型
- 将 wiki 纳入 samples 知识库

依赖变化：
- 指定 streamlit~=1.27.0。1.26.0会报rerun错误，1.28.0会有无限刷新错误

修复优化：
- 优化 get_default_llm_model 逻辑
- 适配 Qwen 在线 API 做 Embeddings 时最大 25 行的限制
- 列出知识库磁盘文件时跳过 . 开头的文件
											
										
										
											2023-11-09 22:15:52 +08:00
+								                                          model_name: str = LLM_MODELS[0],
-												添加configs/prompt_config.py，允许用户自定义prompt模板： (#1504)

1、 默认包含2个模板，分别用于LLM对话，知识库和搜索引擎对话
2、 server/utils.py提供函数get_prompt_template，获取指定的prompt模板内容（支持热加载）
3、 api.py中chat/knowledge_base_chat/search_engine_chat接口支持prompt_name参数
											
										
										
											2023-09-17 13:27:11 +08:00
+								                                          prompt_name: str = prompt_name,
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								                                          ) -> AsyncIterable[str]:
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								        callback = AsyncIteratorCallbackHandler()
-												*_chat 接口中，当 max_tokens=0时，将其设为 None,避免 swagger ui 中默认值为0时访问出错

											
										
										
											2023-11-26 16:47:58 +08:00
+								        if isinstance(max_tokens, int) and max_tokens <= 0:
 								            max_tokens = None
-												优化configs (#1474)

* remove llm_model_dict

* optimize configs

* fix get_model_path

* 更改一些默认参数，添加千帆的默认配置

* Update server_config.py.example
											
										
										
											2023-09-15 17:52:22 +08:00
+								        model = get_ChatOpenAI(
-												添加切换模型功能，支持智谱AI在线模型 (#1342)

* 添加LLM模型切换功能，需要在server_config中设置可切换的模型
* add tests for api.py/llm_model/*
* - 支持模型切换
- 支持智普AI线上模型
- startup.py增加参数`--api-worker`，自动运行所有的线上API模型。使用`-a
  (--all-webui), --all-api`时默认开启该选项
* 修复被fastchat覆盖的标准输出
* 对fastchat日志进行更细致的控制，startup.py中增加-q(--quiet)开关，可以减少无用的fastchat日志输出
* 修正chatglm api的对话模板


Co-authored-by: liunux4odoo <liunu@qq.com>
											
										
										
											2023-09-01 23:58:09 +08:00
+								            model_name=model_name,
-												对话接口支持temperature参数 (#1455)


											
										
										
											2023-09-13 10:00:54 +08:00
+								            temperature=temperature,
-												add paramter `max_tokens` to 4 chat api with default value 1024 (#1744)


											
										
										
											2023-10-12 16:18:56 +08:00
+								            max_tokens=max_tokens,
-												优化configs (#1474)

* remove llm_model_dict

* optimize configs

* fix get_model_path

* 更改一些默认参数，添加千帆的默认配置

* Update server_config.py.example
											
										
										
											2023-09-15 17:52:22 +08:00
+								            callbacks=[callback],
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								        )
-												支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860)

* move get_default_llm_model from webui to ApiRequest

增加API接口及其测试用例：
- /server/get_prompt_template: 获取服务器配置的 prompt 模板
- 增加知识库多线程访问测试用例

支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话

* fix bug in server.api

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-10-25 08:30:23 +08:00
+								        docs = await lookup_search_engine(query, search_engine_name, top_k, split_result=split_result)
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								        context = "\n".join([doc.page_content for doc in docs])
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								        prompt_template = get_prompt_template("search_engine_chat", prompt_name)
-												添加configs/prompt_config.py，允许用户自定义prompt模板： (#1504)

1、 默认包含2个模板，分别用于LLM对话，知识库和搜索引擎对话
2、 server/utils.py提供函数get_prompt_template，获取指定的prompt模板内容（支持热加载）
3、 api.py中chat/knowledge_base_chat/search_engine_chat接口支持prompt_name参数
											
										
										
											2023-09-17 13:27:11 +08:00
+								        input_msg = History(role="user", content=prompt_template).to_msg_template(False)
-												add history to chat apis

											
										
										
											2023-08-08 23:54:51 +08:00
+								        chat_prompt = ChatPromptTemplate.from_messages(
-												fix #1142: 在History中使用jinja2模板代替f-string，避免消息中含有{ }时出错

											
										
										
											2023-08-23 08:35:26 +08:00
+								            [i.to_msg_template() for i in history] + [input_msg])
-												add history to chat apis

											
										
										
											2023-08-08 23:54:51 +08:00
 								        chain = LLMChain(prompt=chat_prompt, llm=model)
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
 								        # Begin a task that runs in the background.
 								        task = asyncio.create_task(wrap_done(
 								            chain.acall({"context": context, "question": query}),
 								            callback.done),
 								        )
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								        source_documents = [
 								            f"""出处 [{inum + 1}] [{doc.metadata["source"]}]({doc.metadata["source"]}) \n\n{doc.page_content}\n\n"""
 								            for inum, doc in enumerate(docs)
 								        ]
-												一些细节优化 (#1891)

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-10-27 11:52:44 +08:00
+								        if len(source_documents) == 0:  # 没有找到相关资料（不太可能）
 								            source_documents.append(f"""<span style='color:red'>未找到相关文档,该回答为大模型自身能力解答！</span>""")
-												update kb and search chat: disable streaming in swagger besides streaming in ApiRequest

											
										
										
											2023-08-09 23:35:36 +08:00
+								        if stream:
 								            async for token in callback.aiter():
 								                # Use server-sent-events to stream the response
-												fix api and webui: (#1435)

1. fix #1431: 优化知识库问答与搜索引擎问答的API接口，避免docs重复返回
2. startup.py根据configs.log_verbose控制log级别
3. 修复/llm_model/list_models的bug:
   只有一个参数时，fastapi未返回json导致视图函数出错
											
										
										
											2023-09-12 08:31:17 +08:00
+								                yield json.dumps({"answer": token}, ensure_ascii=False)
 								            yield json.dumps({"docs": source_documents}, ensure_ascii=False)
-												update kb and search chat: disable streaming in swagger besides streaming in ApiRequest

											
										
										
											2023-08-09 23:35:36 +08:00
+								        else:
 								            answer = ""
 								            async for token in callback.aiter():
 								                answer += token
-												search_engine_chat bug

											
										
										
											2023-08-24 17:25:54 +08:00
+								            yield json.dumps({"answer": answer,
-												update faiss_kb_service.py

											
										
										
											2023-08-09 22:57:36 +08:00
+								                              "docs": source_documents},
 								                             ensure_ascii=False)
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								        await task
-												添加configs/prompt_config.py，允许用户自定义prompt模板： (#1504)

1、 默认包含2个模板，分别用于LLM对话，知识库和搜索引擎对话
2、 server/utils.py提供函数get_prompt_template，获取指定的prompt模板内容（支持热加载）
3、 api.py中chat/knowledge_base_chat/search_engine_chat接口支持prompt_name参数
											
										
										
											2023-09-17 13:27:11 +08:00
+								    return StreamingResponse(search_engine_chat_iterator(query=query,
 								                                                         search_engine_name=search_engine_name,
 								                                                         top_k=top_k,
 								                                                         history=history,
 								                                                         model_name=model_name,
 								                                                         prompt_name=prompt_name),
-. change bing_search_chat and duckduckgo_search_chat into search_engine_chat
2. add knowledge_base not found to knowledge_base_chat and add search_engine not found to search_engine_chat

											
										
										
											2023-08-03 18:22:36 +08:00
+								                             media_type="text/event-stream")