fix #1142: 在History中使用jinja2模板代替f-string，避免消息中含有{ }时出错

2023-08-23 08:35:26 +08:00 · 2023-08-23 08:35:26 +08:00 · 44edce6bcf
parent 054ae4715d
commit 44edce6bcf
6 changed files with 41 additions and 118 deletions
--- a/configs/model_config.py.example
+++ b/configs/model_config.py.example
@ -142,12 +142,12 @@ SEARCH_ENGINE_TOP_K = 5
 # nltk 模型存储路径
 NLTK_DATA_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "nltk_data")

-# 基于本地知识问答的提示词模版
+# 基于本地知识问答的提示词模版（使用Jinja2语法，简单点就是用双大括号代替f-string的单大括号
 PROMPT_TEMPLATE = """【指令】根据已知信息，简洁和专业的来回答问题。如果无法从中得到答案，请说 “根据已知信息无法回答该问题”，不允许在答案中添加编造成分，答案请使用中文。 

-【已知信息】{context} 
+【已知信息】{{ context }} 

-【问题】{question}"""
+【问题】{{ question }}"""

 # API 是否开启跨域，默认为False，如果需要开启，请设置为True
 # is open cross domain
--- a/server/chat/chat.py
+++ b/server/chat/chat.py
@ -21,7 +21,7 @@ def chat(query: str = Body(..., description="用户输入", examples=["恼羞成
                                       ),
         stream: bool = Body(False, description="流式输出"),
         ):
-    history = [History(**h) if isinstance(h, dict) else h for h in history]
+    history = [History.from_data(h) for h in history]

    async def chat_iterator(query: str,
                            history: List[History] = [],
@ -37,8 +37,9 @@ def chat(query: str = Body(..., description="用户输入", examples=["恼羞成
            model_name=LLM_MODEL
        )

+        input_msg = History(role="user", content="{{ input }}").to_msg_template(False)
        chat_prompt = ChatPromptTemplate.from_messages(
-            [i.to_msg_tuple() for i in history] + [("human", "{input}")])
+            [i.to_msg_template() for i in history] + [input_msg])
        chain = LLMChain(prompt=chat_prompt, llm=model)

        # Begin a task that runs in the background.
--- a/server/chat/github_chat.py
+++ b/server/chat/github_chat.py
@ -1,109 +0,0 @@
-from langchain.document_loaders.github import GitHubIssuesLoader
-from fastapi import Body
-from fastapi.responses import StreamingResponse
-from configs.model_config import (llm_model_dict, LLM_MODEL, SEARCH_ENGINE_TOP_K, PROMPT_TEMPLATE)
-from server.chat.utils import wrap_done
-from server.utils import BaseResponse
-from langchain.chat_models import ChatOpenAI
-from langchain import LLMChain
-from langchain.callbacks import AsyncIteratorCallbackHandler
-from typing import AsyncIterable
-import asyncio
-from langchain.prompts.chat import ChatPromptTemplate
-from typing import List, Optional, Literal
-from server.chat.utils import History
-from langchain.docstore.document import Document
-import json
-import os
-from functools import lru_cache
-from datetime import datetime
-
-
-GITHUB_PERSONAL_ACCESS_TOKEN = os.environ.get("GITHUB_PERSONAL_ACCESS_TOKEN")
-
-
-@lru_cache(1)
-def load_issues(tick: str):
-    '''
-    set tick to a periodic value to refresh cache
-    '''
-    loader = GitHubIssuesLoader(
-        repo="chatchat-space/langchain-chatglm",
-        access_token=GITHUB_PERSONAL_ACCESS_TOKEN,
-        include_prs=True,
-        state="all",
-    )
-    docs = loader.load()
-    return docs
-
-
-def 
-def github_chat(query: str = Body(..., description="用户输入", examples=["本项目最新进展"]),
-                top_k: int = Body(SEARCH_ENGINE_TOP_K, description="检索结果数量"),
-                include_prs: bool = Body(True, description="是否包含PR"),
-                state: Literal['open', 'closed', 'all'] = Body(None, description="Issue/PR状态"),
-                creator: str = Body(None, description="创建者"),
-                history: List[History] = Body([],
-                                            description="历史对话",
-                                            examples=[[
-                                                {"role": "user",
-                                                "content": "介绍一下本项目"},
-                                                {"role": "assistant",
-                                                "content": "LangChain-Chatchat (原 Langchain-ChatGLM): 基于 Langchain 与 ChatGLM 等大语言模型的本地知识库问答应用实现。"}]]
-                                                ),
-                stream: bool = Body(False, description="流式输出"),
-                ):
-    if GITHUB_PERSONAL_ACCESS_TOKEN is None:
-        return BaseResponse(code=404, msg=f"使用本功能需要 GITHUB_PERSONAL_ACCESS_TOKEN")
-
-    async def chat_iterator(query: str,
-                            search_engine_name: str,
-                            top_k: int,
-                            history: Optional[List[History]],
-                            ) -> AsyncIterable[str]:
-        callback = AsyncIteratorCallbackHandler()
-        model = ChatOpenAI(
-            streaming=True,
-            verbose=True,
-            callbacks=[callback],
-            openai_api_key=llm_model_dict[LLM_MODEL]["api_key"],
-            openai_api_base=llm_model_dict[LLM_MODEL]["api_base_url"],
-            model_name=LLM_MODEL
-        )
-
-        docs = lookup_search_engine(query, search_engine_name, top_k)
-        context = "\n".join([doc.page_content for doc in docs])
-
-        chat_prompt = ChatPromptTemplate.from_messages(
-            [i.to_msg_tuple() for i in history] + [("human", PROMPT_TEMPLATE)])
-
-        chain = LLMChain(prompt=chat_prompt, llm=model)
-
-        # Begin a task that runs in the background.
-        task = asyncio.create_task(wrap_done(
-            chain.acall({"context": context, "question": query}),
-            callback.done),
-        )
-
-        source_documents = [
-            f"""出处 [{inum + 1}] [{doc.metadata["source"]}]({doc.metadata["source"]}) \n\n{doc.page_content}\n\n"""
-            for inum, doc in enumerate(docs)
-        ]
-
-        if stream:
-            async for token in callback.aiter():
-                # Use server-sent-events to stream the response
-                yield json.dumps({"answer": token,
-                                  "docs": source_documents},
-                                 ensure_ascii=False)
-        else:
-            answer = ""
-            async for token in callback.aiter():
-                answer += token
-            yield json.dumps({"answer": token,
-                              "docs": source_documents},
-                             ensure_ascii=False)
-        await task
-
-    return StreamingResponse(search_engine_chat_iterator(query, search_engine_name, top_k, history),
-                             media_type="text/event-stream")
--- a/server/chat/knowledge_base_chat.py
+++ b/server/chat/knowledge_base_chat.py
@ -38,7 +38,7 @@ def knowledge_base_chat(query: str = Body(..., description="用户输入", examp
    if kb is None:
        return BaseResponse(code=404, msg=f"未找到知识库 {knowledge_base_name}")

-    history = [History(**h) if isinstance(h, dict) else h for h in history]
+    history = [History.from_data(h) for h in history]

    async def knowledge_base_chat_iterator(query: str,
                                           kb: KBService,
@ -57,8 +57,9 @@ def knowledge_base_chat(query: str = Body(..., description="用户输入", examp
        docs = search_docs(query, knowledge_base_name, top_k, score_threshold)
        context = "\n".join([doc.page_content for doc in docs])

+        input_msg = History(role="user", content=PROMPT_TEMPLATE).to_msg_template(False)
        chat_prompt = ChatPromptTemplate.from_messages(
-            [i.to_msg_tuple() for i in history] + [("human", PROMPT_TEMPLATE)])
+            [i.to_msg_template() for i in history] + [input_msg])

        chain = LLMChain(prompt=chat_prompt, llm=model)

--- a/server/chat/search_engine_chat.py
+++ b/server/chat/search_engine_chat.py
@ -73,6 +73,8 @@ def search_engine_chat(query: str = Body(..., description="用户输入", exampl
    if search_engine_name not in SEARCH_ENGINES.keys():
        return BaseResponse(code=404, msg=f"未支持搜索引擎 {search_engine_name}")

+    history = [History.from_data(h) for h in history]
+
    async def search_engine_chat_iterator(query: str,
                                          search_engine_name: str,
                                          top_k: int,
@ -91,8 +93,9 @@ def search_engine_chat(query: str = Body(..., description="用户输入", exampl
        docs = lookup_search_engine(query, search_engine_name, top_k)
        context = "\n".join([doc.page_content for doc in docs])

+        input_msg = History(role="user", content=PROMPT_TEMPLATE).to_msg_template(False)
        chat_prompt = ChatPromptTemplate.from_messages(
-            [i.to_msg_tuple() for i in history] + [("human", PROMPT_TEMPLATE)])
+            [i.to_msg_template() for i in history] + [input_msg])

        chain = LLMChain(prompt=chat_prompt, llm=model)

--- a/server/chat/utils.py
+++ b/server/chat/utils.py
@ -1,6 +1,7 @@
 import asyncio
-from typing import Awaitable
+from typing import Awaitable, List, Tuple, Dict, Union
 from pydantic import BaseModel, Field
+from langchain.prompts.chat import ChatMessagePromptTemplate


 async def wrap_done(fn: Awaitable, event: asyncio.Event):
@ -28,3 +29,29 @@ class History(BaseModel):

    def to_msg_tuple(self):
        return "ai" if self.role=="assistant" else "human", self.content
+
+    def to_msg_template(self, is_raw=True) -> ChatMessagePromptTemplate:
+        role_maps = {
+            "ai": "assistant",
+            "human": "user",
+        }
+        role = role_maps.get(self.role, self.role)
+        if is_raw: # 当前默认历史消息都是没有input_variable的文本。
+            content = "{% raw %}" + self.content + "{% endraw %}"
+        else:
+            content = self.content
+
+        return ChatMessagePromptTemplate.from_template(
+            content,
+            "jinja2",
+            role=role,
+        )
+
+    @classmethod
+    def from_data(cls, h: Union[List, Tuple, Dict]) -> "History":
+        if isinstance(h, (list,tuple)) and len(h) >= 2:
+            h = cls(role=h[0], content=h[1])
+        elif isinstance(h, dict):
+            h = cls(**h)
+
+        return h