Langchain-Chatchat/server/chat/agent_chat.py

from langchain.memory import ConversationBufferWindowMemory
from server.agent.tools import tools, tool_names
from server.agent.callbacks import CustomAsyncIteratorCallbackHandler, Status, dumps
from langchain.agents import AgentExecutor, LLMSingleActionAgent
from server.agent.custom_template import CustomOutputParser, prompt
from fastapi import Body
from fastapi.responses import StreamingResponse
from configs.model_config import LLM_MODEL, TEMPERATURE, HISTORY_LEN
from server.utils import wrap_done, get_ChatOpenAI
from langchain.chains import LLMChain
from typing import AsyncIterable
import asyncio
from langchain.prompts.chat import ChatPromptTemplate
from typing import List
from server.chat.utils import History
import json
async def agent_chat(query: str = Body(..., description="用户输入", examples=["恼羞成怒"]),
                     history: List[History] = Body([],
                                                   description="历史对话",
                                                   examples=[[
                                                       {"role": "user", "content": "我们来玩成语接龙，我先来，生龙活虎"},
                                                       {"role": "assistant", "content": "虎头虎脑"}]]
                                                   ),
                     stream: bool = Body(False, description="流式输出"),
                     model_name: str = Body(LLM_MODEL, description="LLM 模型名称。"),
                     temperature: float = Body(TEMPERATURE, description="LLM 采样温度", ge=0.0, le=1.0),
                     # top_p: float = Body(TOP_P, description="LLM 核采样。勿与temperature同时设置", gt=0.0, lt=1.0),
                     ):
    history = [History.from_data(h) for h in history]

    async def chat_iterator() -> AsyncIterable[str]:
        callback = CustomAsyncIteratorCallbackHandler()
        model = get_ChatOpenAI(
            model_name=model_name,
            temperature=temperature,
        )
        output_parser = CustomOutputParser()
        llm_chain = LLMChain(llm=model, prompt=prompt)
        agent = LLMSingleActionAgent(
            llm_chain=llm_chain,
            output_parser=output_parser,
            stop=["\nObservation:"],
            allowed_tools=tool_names,
        )
        # 把history转成agent的memory
        memory = ConversationBufferWindowMemory(k=100)

        for message in history:
            # 检查消息的角色
            if message.role == 'user':
                # 添加用户消息
                memory.chat_memory.add_user_message(message.content)
            else:
                # 添加AI消息
                memory.chat_memory.add_ai_message(message.content)

        agent_executor = AgentExecutor.from_agent_and_tools(agent=agent,
                                                            tools=tools,
                                                            verbose=True,
                                                            memory=memory,
                                                            )
        # TODO: history is not used
        input_msg = History(role="user", content="{{ input }}").to_msg_template(False)
        chat_prompt = ChatPromptTemplate.from_messages(
            [i.to_msg_template() for i in history] + [input_msg])
        task = asyncio.create_task(wrap_done(
            agent_executor.acall(query, callbacks=[callback], include_run_info=True),
            callback.done),
        )
        if stream:
            async for chunk in callback.aiter():
                tools_use = []
                # Use server-sent-events to stream the response
                data = json.loads(chunk)
                if data["status"] == Status.start or data["status"] == Status.complete:
                    continue
                if data["status"] == Status.agent_action:
                    yield json.dumps({"answer": "(正在使用工具，请注意工具栏变化) \n\n"}, ensure_ascii=False)
                if data["status"] == Status.agent_finish:
                    tools_use.append("工具名称: " + data["tool_name"])
                    tools_use.append("工具输入: " + data["input_str"])
                    tools_use.append("工具输出: " + data["output_str"])
                    yield json.dumps({"tools": tools_use}, ensure_ascii=False)
                yield json.dumps({"answer": data["llm_token"]}, ensure_ascii=False)

        else:
            pass
            # agent必须要steram=True
            # result = []
            # async for chunk in callback.aiter():
            #     data = json.loads(chunk)
            #     status = data["status"]
            #     if status == Status.start:
            #         result.append(chunk)
            #     elif status == Status.running:
            #         result[-1]["llm_token"] += chunk["llm_token"]
            #     elif status == Status.complete:
            #         result[-1]["status"] = Status.complete
            #     elif status == Status.agent_finish:
            #         result.append(chunk)
            #     elif status == Status.agent_finish:
            #         pass
            # yield dumps(result)

        await task

    return StreamingResponse(chat_iterator(),
                             media_type="text/event-stream")
第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00			`from langchain.memory import ConversationBufferWindowMemory`
			`from server.agent.tools import tools, tool_names`
增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) 2023-09-27 19:19:25 +08:00			`from server.agent.callbacks import CustomAsyncIteratorCallbackHandler, Status, dumps`
第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00			`from langchain.agents import AgentExecutor, LLMSingleActionAgent`
			`from server.agent.custom_template import CustomOutputParser, prompt`
			`from fastapi import Body`
			`from fastapi.responses import StreamingResponse`
			`from configs.model_config import LLM_MODEL, TEMPERATURE, HISTORY_LEN`
move wrap_done & get_ChatOpenAI from server.chat.utils to server.utils (#1506) 2023-09-17 16:19:50 +08:00			`from server.utils import wrap_done, get_ChatOpenAI`
fix: langchain warnings for import from root 2023-09-27 21:53:47 +08:00			`from langchain.chains import LLMChain`
第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00			`from typing import AsyncIterable`
			`import asyncio`
			`from langchain.prompts.chat import ChatPromptTemplate`
			`from typing import List`
			`from server.chat.utils import History`
增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) 2023-09-27 19:19:25 +08:00			`import json`
第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00			`async def agent_chat(query: str = Body(..., description="用户输入", examples=["恼羞成怒"]),`
增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) 2023-09-27 19:19:25 +08:00			`history: List[History] = Body([],`
			`description="历史对话",`
			`examples=[[`
			`{"role": "user", "content": "我们来玩成语接龙，我先来，生龙活虎"},`
			`{"role": "assistant", "content": "虎头虎脑"}]]`
			`),`
			`stream: bool = Body(False, description="流式输出"),`
			`model_name: str = Body(LLM_MODEL, description="LLM 模型名称。"),`
Dev (#1613) * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 * issue提到的一个bug * 温度最小改成0，但是不应该支持负数 * 修改了最小的温度 2023-09-27 21:17:50 +08:00			`temperature: float = Body(TEMPERATURE, description="LLM 采样温度", ge=0.0, le=1.0),`
增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) 2023-09-27 19:19:25 +08:00			`# top_p: float = Body(TOP_P, description="LLM 核采样。勿与temperature同时设置", gt=0.0, lt=1.0),`
			`):`
第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00			`history = [History.from_data(h) for h in history]`

增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) 2023-09-27 19:19:25 +08:00			`async def chat_iterator() -> AsyncIterable[str]:`
			`callback = CustomAsyncIteratorCallbackHandler()`
第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00			`model = get_ChatOpenAI(`
			`model_name=model_name,`
			`temperature=temperature,`
			`)`
			`output_parser = CustomOutputParser()`
			`llm_chain = LLMChain(llm=model, prompt=prompt)`
			`agent = LLMSingleActionAgent(`
			`llm_chain=llm_chain,`
			`output_parser=output_parser,`
			`stop=["\nObservation:"],`
增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) 2023-09-27 19:19:25 +08:00			`allowed_tools=tool_names,`
第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00			`)`
增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) 2023-09-27 19:19:25 +08:00			`# 把history转成agent的memory`
			`memory = ConversationBufferWindowMemory(k=100)`

			`for message in history:`
			`# 检查消息的角色`
			`if message.role == 'user':`
			`# 添加用户消息`
			`memory.chat_memory.add_user_message(message.content)`
			`else:`
			`# 添加AI消息`
			`memory.chat_memory.add_ai_message(message.content)`

			`agent_executor = AgentExecutor.from_agent_and_tools(agent=agent,`
			`tools=tools,`
			`verbose=True,`
			`memory=memory,`
			`)`
			`# TODO: history is not used`
第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00			`input_msg = History(role="user", content="{{ input }}").to_msg_template(False)`
			`chat_prompt = ChatPromptTemplate.from_messages(`
			`[i.to_msg_template() for i in history] + [input_msg])`
			`task = asyncio.create_task(wrap_done(`
增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) 2023-09-27 19:19:25 +08:00			`agent_executor.acall(query, callbacks=[callback], include_run_info=True),`
第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00			`callback.done),`
			`)`
			`if stream:`
增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) 2023-09-27 19:19:25 +08:00			`async for chunk in callback.aiter():`
			`tools_use = []`
第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00			`# Use server-sent-events to stream the response`
增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) 2023-09-27 19:19:25 +08:00			`data = json.loads(chunk)`
			`if data["status"] == Status.start or data["status"] == Status.complete:`
			`continue`
			`if data["status"] == Status.agent_action:`
			`yield json.dumps({"answer": "(正在使用工具，请注意工具栏变化) \n\n"}, ensure_ascii=False)`
			`if data["status"] == Status.agent_finish:`
			`tools_use.append("工具名称: " + data["tool_name"])`
			`tools_use.append("工具输入: " + data["input_str"])`
			`tools_use.append("工具输出: " + data["output_str"])`
			`yield json.dumps({"tools": tools_use}, ensure_ascii=False)`
			`yield json.dumps({"answer": data["llm_token"]}, ensure_ascii=False)`

第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00			`else:`
增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) 2023-09-27 19:19:25 +08:00			`pass`
			`# agent必须要steram=True`
			`# result = []`
			`# async for chunk in callback.aiter():`
			`# data = json.loads(chunk)`
			`# status = data["status"]`
			`# if status == Status.start:`
			`# result.append(chunk)`
			`# elif status == Status.running:`
			`# result[-1]["llm_token"] += chunk["llm_token"]`
			`# elif status == Status.complete:`
			`# result[-1]["status"] = Status.complete`
			`# elif status == Status.agent_finish:`
			`# result.append(chunk)`
			`# elif status == Status.agent_finish:`
			`# pass`
			`# yield dumps(result)`
第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00
			`await task`

增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) 2023-09-27 19:19:25 +08:00			`return StreamingResponse(chat_iterator(),`
第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> 2023-09-17 11:19:16 +08:00			`media_type="text/event-stream")`