Langchain-Chatchat/server/chat/agent_chat.py

from langchain.memory import ConversationBufferWindowMemory

from server.agent.custom_agent.ChatGLM3Agent import initialize_glm3_agent
from server.agent.tools_select import tools, tool_names
from server.agent.callbacks import CustomAsyncIteratorCallbackHandler, Status
from langchain.agents import LLMSingleActionAgent, AgentExecutor
from server.agent.custom_template import CustomOutputParser, CustomPromptTemplate
from fastapi import Body
from fastapi.responses import StreamingResponse
from configs import LLM_MODELS, TEMPERATURE, HISTORY_LEN, Agent_MODEL
from server.utils import wrap_done, get_ChatOpenAI, get_prompt_template
from langchain.chains import LLMChain
from typing import AsyncIterable, Optional
import asyncio
from typing import List
from server.chat.utils import History
import json
from server.agent import model_container
from server.knowledge_base.kb_service.base import get_kb_details


async def agent_chat(query: str = Body(..., description="用户输入", examples=["恼羞成怒"]),
                     history: List[History] = Body([],
                                                   description="历史对话",
                                                   examples=[[
                                                       {"role": "user", "content": "请使用知识库工具查询今天北京天气"},
                                                       {"role": "assistant",
                                                        "content": "使用天气查询工具查询到今天北京多云，10-14摄氏度，东北风2级，易感冒"}]]
                                                   ),
                     stream: bool = Body(False, description="流式输出"),
                     model_name: str = Body(LLM_MODELS[0], description="LLM 模型名称。"),
                     temperature: float = Body(TEMPERATURE, description="LLM 采样温度", ge=0.0, le=1.0),
                     max_tokens: Optional[int] = Body(None, description="限制LLM生成Token数量，默认None代表模型最大值"),
                     prompt_name: str = Body("default",
                                             description="使用的prompt模板名称(在configs/prompt_config.py中配置)"),
                     # top_p: float = Body(TOP_P, description="LLM 核采样。勿与temperature同时设置", gt=0.0, lt=1.0),
                     ):
    history = [History.from_data(h) for h in history]

    async def agent_chat_iterator(
            query: str,
            history: Optional[List[History]],
            model_name: str = LLM_MODELS[0],
            prompt_name: str = prompt_name,
    ) -> AsyncIterable[str]:
        callback = CustomAsyncIteratorCallbackHandler()
        model = get_ChatOpenAI(
            model_name=model_name,
            temperature=temperature,
            max_tokens=max_tokens,
            callbacks=[callback],
        )

        ## 传入全局变量来实现agent调用
        kb_list = {x["kb_name"]: x for x in get_kb_details()}
        model_container.DATABASE = {name: details['kb_info'] for name, details in kb_list.items()}

        if Agent_MODEL:
            ## 如果有指定使用Agent模型来完成任务
            model_agent = get_ChatOpenAI(
                model_name=Agent_MODEL,
                temperature=temperature,
                max_tokens=max_tokens,
                callbacks=[callback],
            )
            model_container.MODEL = model_agent
        else:
            model_container.MODEL = model

        prompt_template = get_prompt_template("agent_chat", prompt_name)
        prompt_template_agent = CustomPromptTemplate(
            template=prompt_template,
            tools=tools,
            input_variables=["input", "intermediate_steps", "history"]
        )
        output_parser = CustomOutputParser()
        llm_chain = LLMChain(llm=model, prompt=prompt_template_agent)
        # 把history转成agent的memory
        memory = ConversationBufferWindowMemory(k=HISTORY_LEN * 2)
        for message in history:
            # 检查消息的角色
            if message.role == 'user':
                # 添加用户消息
                memory.chat_memory.add_user_message(message.content)
            else:
                # 添加AI消息
                memory.chat_memory.add_ai_message(message.content)

        if "chatglm3" in model_container.MODEL.model_name:
            agent_executor = initialize_glm3_agent(
                llm=model,
                tools=tools,
                callback_manager=None,
                verbose=True,
                memory=memory,
            )
        else:
            agent = LLMSingleActionAgent(
                llm_chain=llm_chain,
                output_parser=output_parser,
                stop=["\nObservation:", "Observation"],
                allowed_tools=tool_names,
            )
            agent_executor = AgentExecutor.from_agent_and_tools(agent=agent,
                                                                tools=tools,
                                                                verbose=True,
                                                                memory=memory,
                                                                )
        while True:
            try:
                task = asyncio.create_task(wrap_done(
                    agent_executor.acall(query, callbacks=[callback], include_run_info=True),
                    callback.done))
                break
            except:
                pass

        if stream:
            async for chunk in callback.aiter():
                tools_use = []
                # Use server-sent-events to stream the response
                data = json.loads(chunk)
                if data["status"] == Status.start or data["status"] == Status.complete:
                    continue
                elif data["status"] == Status.error:
                    tools_use.append("\n```\n")
                    tools_use.append("工具名称: " + data["tool_name"])
                    tools_use.append("工具状态: " + "调用失败")
                    tools_use.append("错误信息: " + data["error"])
                    tools_use.append("重新开始尝试")
                    tools_use.append("\n```\n")
                    yield json.dumps({"tools": tools_use}, ensure_ascii=False)
                elif data["status"] == Status.tool_finish:
                    tools_use.append("\n```\n")
                    tools_use.append("工具名称: " + data["tool_name"])
                    tools_use.append("工具状态: " + "调用成功")
                    tools_use.append("工具输入: " + data["input_str"])
                    tools_use.append("工具输出: " + data["output_str"])
                    tools_use.append("\n```\n")
                    yield json.dumps({"tools": tools_use}, ensure_ascii=False)
                elif data["status"] == Status.agent_finish:
                    yield json.dumps({"final_answer": data["final_answer"]}, ensure_ascii=False)
                else:
                    yield json.dumps({"answer": data["llm_token"]}, ensure_ascii=False)


        else:
            answer = ""
            final_answer = ""
            async for chunk in callback.aiter():
                # Use server-sent-events to stream the response
                data = json.loads(chunk)
                if data["status"] == Status.start or data["status"] == Status.complete:
                    continue
                if data["status"] == Status.error:
                    answer += "\n```\n"
                    answer += "工具名称: " + data["tool_name"] + "\n"
                    answer += "工具状态: " + "调用失败" + "\n"
                    answer += "错误信息: " + data["error"] + "\n"
                    answer += "\n```\n"
                if data["status"] == Status.tool_finish:
                    answer += "\n```\n"
                    answer += "工具名称: " + data["tool_name"] + "\n"
                    answer += "工具状态: " + "调用成功" + "\n"
                    answer += "工具输入: " + data["input_str"] + "\n"
                    answer += "工具输出: " + data["output_str"] + "\n"
                    answer += "\n```\n"
                if data["status"] == Status.agent_finish:
                    final_answer = data["final_answer"]
                else:
                    answer += data["llm_token"]

            yield json.dumps({"answer": answer, "final_answer": final_answer}, ensure_ascii=False)
        await task

    return StreamingResponse(agent_chat_iterator(query=query,
                                                 history=history,
                                                 model_name=model_name,
                                                 prompt_name=prompt_name),
                             media_type="text/event-stream")
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								from langchain.memory import ConversationBufferWindowMemory
-												支持ChatGLM3-6B (#2021)

* 更新依赖和配置文件中的Agent模型

* 支持基础的glm3_agent
											
										
										
											2023-11-12 16:45:50 +08:00
 								from server.agent.custom_agent.ChatGLM3Agent import initialize_glm3_agent
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								from server.agent.tools_select import tools, tool_names
 								from server.agent.callbacks import CustomAsyncIteratorCallbackHandler, Status
-												支持ChatGLM3-6B (#2021)

* 更新依赖和配置文件中的Agent模型

* 支持基础的glm3_agent
											
										
										
											2023-11-12 16:45:50 +08:00
+								from langchain.agents import LLMSingleActionAgent, AgentExecutor
-												Dev (#1618)

* 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写

* issue提到的一个bug

* 温度最小改成0，但是不应该支持负数

* 修改了最小的温度

* 增加了部分Agent支持和修改了启动文件的部分bug

* 修改了GPU数量配置文件

* 1

1

* 修复配置文件错误

* 更新readme，稳定测试
											
										
										
											2023-09-28 20:19:26 +08:00
+								from server.agent.custom_template import CustomOutputParser, CustomPromptTemplate
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								from fastapi import Body
 								from fastapi.responses import StreamingResponse
-												支持通过配置项同时启动多个模型，将Wiki纳入samples知识库 (#2002)

新功能：
- 将 LLM_MODEL 配置项改为 LLM_MODELS 列表，同时启动多个模型
- 将 wiki 纳入 samples 知识库

依赖变化：
- 指定 streamlit~=1.27.0。1.26.0会报rerun错误，1.28.0会有无限刷新错误

修复优化：
- 优化 get_default_llm_model 逻辑
- 适配 Qwen 在线 API 做 Embeddings 时最大 25 行的限制
- 列出知识库磁盘文件时跳过 . 开头的文件
											
										
										
											2023-11-09 22:15:52 +08:00
+								from configs import LLM_MODELS, TEMPERATURE, HISTORY_LEN, Agent_MODEL
-												Dev (#1618)

* 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写

* issue提到的一个bug

* 温度最小改成0，但是不应该支持负数

* 修改了最小的温度

* 增加了部分Agent支持和修改了启动文件的部分bug

* 修改了GPU数量配置文件

* 1

1

* 修复配置文件错误

* 更新readme，稳定测试
											
										
										
											2023-09-28 20:19:26 +08:00
+								from server.utils import wrap_done, get_ChatOpenAI, get_prompt_template
-												fix: langchain warnings for import from root

											
										
										
											2023-09-27 21:53:47 +08:00
+								from langchain.chains import LLMChain
-												支持ChatGLM3-6B (#2021)

* 更新依赖和配置文件中的Agent模型

* 支持基础的glm3_agent
											
										
										
											2023-11-12 16:45:50 +08:00
+								from typing import AsyncIterable, Optional
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								import asyncio
 								from typing import List
 								from server.chat.utils import History
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
+								import json
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								from server.agent import model_container
 								from server.knowledge_base.kb_service.base import get_kb_details
-												Dev (#1618)

* 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写

* issue提到的一个bug

* 温度最小改成0，但是不应该支持负数

* 修改了最小的温度

* 增加了部分Agent支持和修改了启动文件的部分bug

* 修改了GPU数量配置文件

* 1

1

* 修复配置文件错误

* 更新readme，稳定测试
											
										
										
											2023-09-28 20:19:26 +08:00
-												支持GLM (#1896)

* 支持glm3
											
										
										
											2023-10-27 17:56:27 +08:00
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								async def agent_chat(query: str = Body(..., description="用户输入", examples=["恼羞成怒"]),
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
+								                     history: List[History] = Body([],
 								                                                   description="历史对话",
 								                                                   examples=[[
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								                                                       {"role": "user", "content": "请使用知识库工具查询今天北京天气"},
-												支持GLM (#1896)

* 支持glm3
											
										
										
											2023-10-27 17:56:27 +08:00
+								                                                       {"role": "assistant",
 								                                                        "content": "使用天气查询工具查询到今天北京多云，10-14摄氏度，东北风2级，易感冒"}]]
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
+								                                                   ),
 								                     stream: bool = Body(False, description="流式输出"),
-												支持通过配置项同时启动多个模型，将Wiki纳入samples知识库 (#2002)

新功能：
- 将 LLM_MODEL 配置项改为 LLM_MODELS 列表，同时启动多个模型
- 将 wiki 纳入 samples 知识库

依赖变化：
- 指定 streamlit~=1.27.0。1.26.0会报rerun错误，1.28.0会有无限刷新错误

修复优化：
- 优化 get_default_llm_model 逻辑
- 适配 Qwen 在线 API 做 Embeddings 时最大 25 行的限制
- 列出知识库磁盘文件时跳过 . 开头的文件
											
										
										
											2023-11-09 22:15:52 +08:00
+								                     model_name: str = Body(LLM_MODELS[0], description="LLM 模型名称。"),
-												Dev (#1613)

* 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写

* issue提到的一个bug

* 温度最小改成0，但是不应该支持负数

* 修改了最小的温度
											
										
										
											2023-09-27 21:17:50 +08:00
+								                     temperature: float = Body(TEMPERATURE, description="LLM 采样温度", ge=0.0, le=1.0),
-												优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式 (#1886)

* 优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式

新功能
- 智谱AI、Minimax、千帆、千问 4 个在线模型支持 embeddings（不通过Fastchat，后续会单独提供相关api接口）
- 在线模型自动检测传入参数，在传入非 messages 格式的 prompt 时，自动转换为 completion 形式，以支持 completion 接口

开发者：
- 重构ApiModelWorker:
  - 所有在线 API 请求封装到 do_chat 方法：自动传入参数 ApiChatParams，简化参数与配置项的获取；自动处理与fastchat的接口
  - 加强 API 请求错误处理，返回更有意义的信息
  - 改用 qianfan sdk 重写 qianfan-api
  - 将所有在线模型的测试用例统一在一起，简化测试用例编写

* Delete requirements_langflow.txt
											
										
										
											2023-10-26 22:44:48 +08:00
+								                     max_tokens: Optional[int] = Body(None, description="限制LLM生成Token数量，默认None代表模型最大值"),
-												支持GLM (#1896)

* 支持glm3
											
										
										
											2023-10-27 17:56:27 +08:00
+								                     prompt_name: str = Body("default",
 								                                             description="使用的prompt模板名称(在configs/prompt_config.py中配置)"),
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
+								                     # top_p: float = Body(TOP_P, description="LLM 核采样。勿与temperature同时设置", gt=0.0, lt=1.0),
 								                     ):
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								    history = [History.from_data(h) for h in history]
-												Dev (#1618)

* 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写

* issue提到的一个bug

* 温度最小改成0，但是不应该支持负数

* 修改了最小的温度

* 增加了部分Agent支持和修改了启动文件的部分bug

* 修改了GPU数量配置文件

* 1

1

* 修复配置文件错误

* 更新readme，稳定测试
											
										
										
											2023-09-28 20:19:26 +08:00
+								    async def agent_chat_iterator(
 								            query: str,
 								            history: Optional[List[History]],
-												支持通过配置项同时启动多个模型，将Wiki纳入samples知识库 (#2002)

新功能：
- 将 LLM_MODEL 配置项改为 LLM_MODELS 列表，同时启动多个模型
- 将 wiki 纳入 samples 知识库

依赖变化：
- 指定 streamlit~=1.27.0。1.26.0会报rerun错误，1.28.0会有无限刷新错误

修复优化：
- 优化 get_default_llm_model 逻辑
- 适配 Qwen 在线 API 做 Embeddings 时最大 25 行的限制
- 列出知识库磁盘文件时跳过 . 开头的文件
											
										
										
											2023-11-09 22:15:52 +08:00
+								            model_name: str = LLM_MODELS[0],
-												Dev (#1618)

* 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写

* issue提到的一个bug

* 温度最小改成0，但是不应该支持负数

* 修改了最小的温度

* 增加了部分Agent支持和修改了启动文件的部分bug

* 修改了GPU数量配置文件

* 1

1

* 修复配置文件错误

* 更新readme，稳定测试
											
										
										
											2023-09-28 20:19:26 +08:00
+								            prompt_name: str = prompt_name,
 								    ) -> AsyncIterable[str]:
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
+								        callback = CustomAsyncIteratorCallbackHandler()
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								        model = get_ChatOpenAI(
 								            model_name=model_name,
 								            temperature=temperature,
-												add paramter `max_tokens` to 4 chat api with default value 1024 (#1744)


											
										
										
											2023-10-12 16:18:56 +08:00
+								            max_tokens=max_tokens,
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								            callbacks=[callback],
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								        )
-												Dev (#1618)

* 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写

* issue提到的一个bug

* 温度最小改成0，但是不应该支持负数

* 修改了最小的温度

* 增加了部分Agent支持和修改了启动文件的部分bug

* 修改了GPU数量配置文件

* 1

1

* 修复配置文件错误

* 更新readme，稳定测试
											
										
										
											2023-09-28 20:19:26 +08:00
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								        ## 传入全局变量来实现agent调用
 								        kb_list = {x["kb_name"]: x for x in get_kb_details()}
 								        model_container.DATABASE = {name: details['kb_info'] for name, details in kb_list.items()}
-												Dev (#1822)

* 支持了agentlm

* 支持了agentlm和相关提示词

* 修改了Agent的一些功能，加入了Embed方面的一个优化

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-10-22 00:00:15 +08:00
 								        if Agent_MODEL:
 								            ## 如果有指定使用Agent模型来完成任务
 								            model_agent = get_ChatOpenAI(
 								                model_name=Agent_MODEL,
 								                temperature=temperature,
 								                max_tokens=max_tokens,
 								                callbacks=[callback],
 								            )
 								            model_container.MODEL = model_agent
 								        else:
 								            model_container.MODEL = model
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
 								        prompt_template = get_prompt_template("agent_chat", prompt_name)
 								        prompt_template_agent = CustomPromptTemplate(
 								            template=prompt_template,
-												Dev (#1618)

* 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写

* issue提到的一个bug

* 温度最小改成0，但是不应该支持负数

* 修改了最小的温度

* 增加了部分Agent支持和修改了启动文件的部分bug

* 修改了GPU数量配置文件

* 1

1

* 修复配置文件错误

* 更新readme，稳定测试
											
										
										
											2023-09-28 20:19:26 +08:00
+								            tools=tools,
 								            input_variables=["input", "intermediate_steps", "history"]
 								        )
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								        output_parser = CustomOutputParser()
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								        llm_chain = LLMChain(llm=model, prompt=prompt_template_agent)
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
+								        # 把history转成agent的memory
-												Dev (#1618)

* 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写

* issue提到的一个bug

* 温度最小改成0，但是不应该支持负数

* 修改了最小的温度

* 增加了部分Agent支持和修改了启动文件的部分bug

* 修改了GPU数量配置文件

* 1

1

* 修复配置文件错误

* 更新readme，稳定测试
											
										
										
											2023-09-28 20:19:26 +08:00
+								        memory = ConversationBufferWindowMemory(k=HISTORY_LEN * 2)
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
+								        for message in history:
 								            # 检查消息的角色
 								            if message.role == 'user':
 								                # 添加用户消息
 								                memory.chat_memory.add_user_message(message.content)
 								            else:
 								                # 添加AI消息
 								                memory.chat_memory.add_ai_message(message.content)
-												支持ChatGLM3-6B (#2021)

* 更新依赖和配置文件中的Agent模型

* 支持基础的glm3_agent
											
										
										
											2023-11-12 16:45:50 +08:00
 								        if "chatglm3" in model_container.MODEL.model_name:
 								            agent_executor = initialize_glm3_agent(
 								                llm=model,
 								                tools=tools,
 								                callback_manager=None,
 								                verbose=True,
 								                memory=memory,
 								            )
 								        else:
 								            agent = LLMSingleActionAgent(
 								                llm_chain=llm_chain,
 								                output_parser=output_parser,
 								                stop=["\nObservation:", "Observation"],
 								                allowed_tools=tool_names,
 								            )
 								            agent_executor = AgentExecutor.from_agent_and_tools(agent=agent,
 								                                                                tools=tools,
 								                                                                verbose=True,
 								                                                                memory=memory,
 								                                                                )
-												Agent大更新合并 (#1666)

* 更新上agent提示词代码

* 更新部分文档，修复了issue中提到的bge匹配超过1 的bug

* 按需修改

* 解决了部分最新用户用依赖的bug，加了两个工具，移除google工具

* Agent大幅度优化

1. 修改了UI界面
(1)高亮所有没有进行agent对齐的模型，
(2)优化输出体验和逻辑，使用markdown

2. 降低天气工具使用门槛
3. 依赖更新
(1) vllm 更新到0.2.0，增加了一些参数
(2) torch 建议更新到2.1
(3)pydantic不要更新到1.10.12
											
										
										
											2023-10-07 11:26:11 +08:00
+								        while True:
 								            try:
 								                task = asyncio.create_task(wrap_done(
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								                    agent_executor.acall(query, callbacks=[callback], include_run_info=True),
 								                    callback.done))
-												Agent大更新合并 (#1666)

* 更新上agent提示词代码

* 更新部分文档，修复了issue中提到的bge匹配超过1 的bug

* 按需修改

* 解决了部分最新用户用依赖的bug，加了两个工具，移除google工具

* Agent大幅度优化

1. 修改了UI界面
(1)高亮所有没有进行agent对齐的模型，
(2)优化输出体验和逻辑，使用markdown

2. 降低天气工具使用门槛
3. 依赖更新
(1) vllm 更新到0.2.0，增加了一些参数
(2) torch 建议更新到2.1
(3)pydantic不要更新到1.10.12
											
										
										
											2023-10-07 11:26:11 +08:00
+								                break
 								            except:
 								                pass
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								        if stream:
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
+								            async for chunk in callback.aiter():
 								                tools_use = []
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								                # Use server-sent-events to stream the response
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
+								                data = json.loads(chunk)
 								                if data["status"] == Status.start or data["status"] == Status.complete:
 								                    continue
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								                elif data["status"] == Status.error:
 								                    tools_use.append("\n```\n")
-												Agent大更新合并 (#1666)

* 更新上agent提示词代码

* 更新部分文档，修复了issue中提到的bge匹配超过1 的bug

* 按需修改

* 解决了部分最新用户用依赖的bug，加了两个工具，移除google工具

* Agent大幅度优化

1. 修改了UI界面
(1)高亮所有没有进行agent对齐的模型，
(2)优化输出体验和逻辑，使用markdown

2. 降低天气工具使用门槛
3. 依赖更新
(1) vllm 更新到0.2.0，增加了一些参数
(2) torch 建议更新到2.1
(3)pydantic不要更新到1.10.12
											
										
										
											2023-10-07 11:26:11 +08:00
+								                    tools_use.append("工具名称: " + data["tool_name"])
 								                    tools_use.append("工具状态: " + "调用失败")
 								                    tools_use.append("错误信息: " + data["error"])
 								                    tools_use.append("重新开始尝试")
 								                    tools_use.append("\n```\n")
 								                    yield json.dumps({"tools": tools_use}, ensure_ascii=False)
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								                elif data["status"] == Status.tool_finish:
 								                    tools_use.append("\n```\n")
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
+								                    tools_use.append("工具名称: " + data["tool_name"])
-												Agent大更新合并 (#1666)

* 更新上agent提示词代码

* 更新部分文档，修复了issue中提到的bge匹配超过1 的bug

* 按需修改

* 解决了部分最新用户用依赖的bug，加了两个工具，移除google工具

* Agent大幅度优化

1. 修改了UI界面
(1)高亮所有没有进行agent对齐的模型，
(2)优化输出体验和逻辑，使用markdown

2. 降低天气工具使用门槛
3. 依赖更新
(1) vllm 更新到0.2.0，增加了一些参数
(2) torch 建议更新到2.1
(3)pydantic不要更新到1.10.12
											
										
										
											2023-10-07 11:26:11 +08:00
+								                    tools_use.append("工具状态: " + "调用成功")
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
+								                    tools_use.append("工具输入: " + data["input_str"])
 								                    tools_use.append("工具输出: " + data["output_str"])
-												Agent大更新合并 (#1666)

* 更新上agent提示词代码

* 更新部分文档，修复了issue中提到的bge匹配超过1 的bug

* 按需修改

* 解决了部分最新用户用依赖的bug，加了两个工具，移除google工具

* Agent大幅度优化

1. 修改了UI界面
(1)高亮所有没有进行agent对齐的模型，
(2)优化输出体验和逻辑，使用markdown

2. 降低天气工具使用门槛
3. 依赖更新
(1) vllm 更新到0.2.0，增加了一些参数
(2) torch 建议更新到2.1
(3)pydantic不要更新到1.10.12
											
										
										
											2023-10-07 11:26:11 +08:00
+								                    tools_use.append("\n```\n")
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
+								                    yield json.dumps({"tools": tools_use}, ensure_ascii=False)
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								                elif data["status"] == Status.agent_finish:
-												Agent大更新合并 (#1666)

* 更新上agent提示词代码

* 更新部分文档，修复了issue中提到的bge匹配超过1 的bug

* 按需修改

* 解决了部分最新用户用依赖的bug，加了两个工具，移除google工具

* Agent大幅度优化

1. 修改了UI界面
(1)高亮所有没有进行agent对齐的模型，
(2)优化输出体验和逻辑，使用markdown

2. 降低天气工具使用门槛
3. 依赖更新
(1) vllm 更新到0.2.0，增加了一些参数
(2) torch 建议更新到2.1
(3)pydantic不要更新到1.10.12
											
										
										
											2023-10-07 11:26:11 +08:00
+								                    yield json.dumps({"final_answer": data["final_answer"]}, ensure_ascii=False)
 								                else:
 								                    yield json.dumps({"answer": data["llm_token"]}, ensure_ascii=False)
-												增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611)


											
										
										
											2023-09-27 19:19:25 +08:00
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								        else:
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								            answer = ""
 								            final_answer = ""
 								            async for chunk in callback.aiter():
 								                # Use server-sent-events to stream the response
 								                data = json.loads(chunk)
 								                if data["status"] == Status.start or data["status"] == Status.complete:
 								                    continue
 								                if data["status"] == Status.error:
 								                    answer += "\n```\n"
 								                    answer += "工具名称: " + data["tool_name"] + "\n"
 								                    answer += "工具状态: " + "调用失败" + "\n"
 								                    answer += "错误信息: " + data["error"] + "\n"
 								                    answer += "\n```\n"
 								                if data["status"] == Status.tool_finish:
 								                    answer += "\n```\n"
 								                    answer += "工具名称: " + data["tool_name"] + "\n"
 								                    answer += "工具状态: " + "调用成功" + "\n"
 								                    answer += "工具输入: " + data["input_str"] + "\n"
 								                    answer += "工具输出: " + data["output_str"] + "\n"
 								                    answer += "\n```\n"
 								                if data["status"] == Status.agent_finish:
 								                    final_answer = data["final_answer"]
 								                else:
 								                    answer += data["llm_token"]
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
-												北京黑客松更新 (#1785)

* 北京黑客松更新

知识库支持：
支持zilliz数据库
Agent支持：
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传）

知识库更新
1. 支持知识库简介，用于Agent选择
2. UI对应知识库简介

提示词选择
1. UI 和模板支持提示词模板更换选择

											
										
										
											2023-10-18 15:19:02 +08:00
+								            yield json.dumps({"answer": answer, "final_answer": final_answer}, ensure_ascii=False)
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								        await task
-												Dev (#1618)

* 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写

* issue提到的一个bug

* 温度最小改成0，但是不应该支持负数

* 修改了最小的温度

* 增加了部分Agent支持和修改了启动文件的部分bug

* 修改了GPU数量配置文件

* 1

1

* 修复配置文件错误

* 更新readme，稳定测试
											
										
										
											2023-09-28 20:19:26 +08:00
+								    return StreamingResponse(agent_chat_iterator(query=query,
 								                                                 history=history,
 								                                                 model_name=model_name,
 								                                                 prompt_name=prompt_name),
-												第一版初步agent实现 (#1503)

* 第一版初步agent实现

* 增加steaming参数

* 修改了weather.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-17 11:19:16 +08:00
+								                             media_type="text/event-stream")