Langchain-Chatchat/server/chat/openai_chat.py

from fastapi.responses import StreamingResponse
from typing import List, Optional
import openai
from configs import LLM_MODEL, logger, log_verbose
from server.utils import get_model_worker_config, fschat_openai_api_address
from pydantic import BaseModel


class OpenAiMessage(BaseModel):
    role: str = "user"
    content: str = "hello"


class OpenAiChatMsgIn(BaseModel):
    model: str = LLM_MODEL
    messages: List[OpenAiMessage]
    temperature: float = 0.7
    n: int = 1
    max_tokens: Optional[int] = None
    stop: List[str] = []
    stream: bool = False
    presence_penalty: int = 0
    frequency_penalty: int = 0


async def openai_chat(msg: OpenAiChatMsgIn):
    config = get_model_worker_config(msg.model)
    openai.api_key = config.get("api_key", "EMPTY")
    print(f"{openai.api_key=}")
    openai.api_base = config.get("api_base_url", fschat_openai_api_address())
    print(f"{openai.api_base=}")
    print(msg)

    async def get_response(msg):
        data = msg.dict()

        try:
            response = await openai.ChatCompletion.acreate(**data)
            if msg.stream:
                async for data in response:
                    if choices := data.choices:
                        if chunk := choices[0].get("delta", {}).get("content"):
                            print(chunk, end="", flush=True)
                            yield chunk
            else:
                if response.choices:
                    answer = response.choices[0].message.content
                    print(answer)
                    yield(answer)
        except Exception as e:
            msg = f"获取ChatCompletion时出错：{e}"
            logger.error(f'{e.__class__.__name__}: {msg}',
                         exc_info=e if log_verbose else None)

    return StreamingResponse(
        get_response(msg),
        media_type='text/event-stream',
    )
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								from fastapi.responses import StreamingResponse
-												优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式 (#1886)

* 优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式

新功能
- 智谱AI、Minimax、千帆、千问 4 个在线模型支持 embeddings（不通过Fastchat，后续会单独提供相关api接口）
- 在线模型自动检测传入参数，在传入非 messages 格式的 prompt 时，自动转换为 completion 形式，以支持 completion 接口

开发者：
- 重构ApiModelWorker:
  - 所有在线 API 请求封装到 do_chat 方法：自动传入参数 ApiChatParams，简化参数与配置项的获取；自动处理与fastchat的接口
  - 加强 API 请求错误处理，返回更有意义的信息
  - 改用 qianfan sdk 重写 qianfan-api
  - 将所有在线模型的测试用例统一在一起，简化测试用例编写

* Delete requirements_langflow.txt
											
										
										
											2023-10-26 22:44:48 +08:00
+								from typing import List, Optional
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								import openai
-												优化configs (#1474)

* remove llm_model_dict

* optimize configs

* fix get_model_path

* 更改一些默认参数，添加千帆的默认配置

* Update server_config.py.example
											
										
										
											2023-09-15 17:52:22 +08:00
+								from configs import LLM_MODEL, logger, log_verbose
 								from server.utils import get_model_worker_config, fschat_openai_api_address
-												修改server.chat.openai_chat中的参数定义，使其与openai中/v1/chat/completions接口的入参保持一致，并按照model_config提供默认值。
openai_chat中的接口还要修改：openai根据参数stream有不同的返回值，本接口要与其对应。

											
										
										
											2023-07-30 08:56:49 +08:00
+								from pydantic import BaseModel
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
-												修改server.chat.openai_chat中的参数定义，使其与openai中/v1/chat/completions接口的入参保持一致，并按照model_config提供默认值。
openai_chat中的接口还要修改：openai根据参数stream有不同的返回值，本接口要与其对应。

											
										
										
											2023-07-30 08:56:49 +08:00
 								class OpenAiMessage(BaseModel):
 								    role: str = "user"
 								    content: str = "hello"
 								class OpenAiChatMsgIn(BaseModel):
 								    model: str = LLM_MODEL
 								    messages: List[OpenAiMessage]
 								    temperature: float = 0.7
 								    n: int = 1
-												优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式 (#1886)

* 优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式

新功能
- 智谱AI、Minimax、千帆、千问 4 个在线模型支持 embeddings（不通过Fastchat，后续会单独提供相关api接口）
- 在线模型自动检测传入参数，在传入非 messages 格式的 prompt 时，自动转换为 completion 形式，以支持 completion 接口

开发者：
- 重构ApiModelWorker:
  - 所有在线 API 请求封装到 do_chat 方法：自动传入参数 ApiChatParams，简化参数与配置项的获取；自动处理与fastchat的接口
  - 加强 API 请求错误处理，返回更有意义的信息
  - 改用 qianfan sdk 重写 qianfan-api
  - 将所有在线模型的测试用例统一在一起，简化测试用例编写

* Delete requirements_langflow.txt
											
										
										
											2023-10-26 22:44:48 +08:00
+								    max_tokens: Optional[int] = None
-												修改server.chat.openai_chat中的参数定义，使其与openai中/v1/chat/completions接口的入参保持一致，并按照model_config提供默认值。
openai_chat中的接口还要修改：openai根据参数stream有不同的返回值，本接口要与其对应。

											
										
										
											2023-07-30 08:56:49 +08:00
+								    stop: List[str] = []
-												update fastch_chat: disable streaming in swagger besides streaming in ApiRequest

											
										
										
											2023-08-09 23:48:41 +08:00
+								    stream: bool = False
-												修改server.chat.openai_chat中的参数定义，使其与openai中/v1/chat/completions接口的入参保持一致，并按照model_config提供默认值。
openai_chat中的接口还要修改：openai根据参数stream有不同的返回值，本接口要与其对应。

											
										
										
											2023-07-30 08:56:49 +08:00
+								    presence_penalty: int = 0
 								    frequency_penalty: int = 0
 								async def openai_chat(msg: OpenAiChatMsgIn):
-												优化configs (#1474)

* remove llm_model_dict

* optimize configs

* fix get_model_path

* 更改一些默认参数，添加千帆的默认配置

* Update server_config.py.example
											
										
										
											2023-09-15 17:52:22 +08:00
+								    config = get_model_worker_config(msg.model)
 								    openai.api_key = config.get("api_key", "EMPTY")
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								    print(f"{openai.api_key=}")
-												修复ChatGPT api_base_url错误；用户可以在model_config在线模型配置中覆盖默认的api_base_url (#1496)


											
										
										
											2023-09-15 22:56:13 +08:00
+								    openai.api_base = config.get("api_base_url", fschat_openai_api_address())
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								    print(f"{openai.api_base=}")
-												修改server.chat.openai_chat中的参数定义，使其与openai中/v1/chat/completions接口的入参保持一致，并按照model_config提供默认值。
openai_chat中的接口还要修改：openai根据参数stream有不同的返回值，本接口要与其对应。

											
										
										
											2023-07-30 08:56:49 +08:00
+								    print(msg)
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
-												改变api视图函数的sync/async，提高api并发能力： (#1414)

1. 4个chat类接口改为async
2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发
											
										
										
											2023-09-08 12:25:02 +08:00
+								    async def get_response(msg):
-												update fastch_chat: disable streaming in swagger besides streaming in ApiRequest

											
										
										
											2023-08-09 23:48:41 +08:00
+								        data = msg.dict()
-												fix api & webui: 1.add logs, 2. check json response, 3. set timeout=False in recreate_vector_stoore

											
										
										
											2023-08-15 14:24:54 +08:00
 								        try:
-												改变api视图函数的sync/async，提高api并发能力： (#1414)

1. 4个chat类接口改为async
2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发
											
										
										
											2023-09-08 12:25:02 +08:00
+								            response = await openai.ChatCompletion.acreate(**data)
-												fix api & webui: 1.add logs, 2. check json response, 3. set timeout=False in recreate_vector_stoore

											
										
										
											2023-08-15 14:24:54 +08:00
+								            if msg.stream:
-												改变api视图函数的sync/async，提高api并发能力： (#1414)

1. 4个chat类接口改为async
2. 知识库操作，涉及向量库修改的使用async，避免FAISS写入错误；涉及向量库读取的改为sync，提高并发
											
										
										
											2023-09-08 12:25:02 +08:00
+								                async for data in response:
-												增加数据库字段，重建知识库使用多线程 (#1280)

* close #1172: 给webui_page/utils添加一些log信息，方便定位错误

* 修复：重建知识库时页面未实时显示进度

* skip model_worker running when using online model api such as chatgpt

* 修改知识库管理相关内容:
1.KnowledgeFileModel增加3个字段：file_mtime(文件修改时间),file_size(文件大小),custom_docs(是否使用自定义docs)。为后面比对上传文件做准备。
2.给所有String字段加上长度，防止mysql建表错误(pr#1177)
3.统一[faiss/milvus/pgvector]_kb_service.add_doc接口，使其支持自定义docs
4.为faiss_kb_service增加一些方法，便于调用
5.为KnowledgeFile增加一些方法，便于获取文件信息，缓存file2text的结果。

* 修复/chat/fastchat无法流式输出的问题

* 新增功能：
1、KnowledgeFileModel增加"docs_count"字段，代表该文件加载到向量库中的Document数量，并在WEBUI中进行展示。
2、重建知识库`python init_database.py --recreate-vs`支持多线程。

其它：
统一代码中知识库相关函数用词：file代表一个文件名称或路径，doc代表langchain加载后的Document。部分与API接口有关或含义重叠的函数暂未修改。

---------

Co-authored-by: liunux4odoo <liunux@qq.com>, hongkong9771 
											
										
										
											2023-08-28 13:50:35 +08:00
+								                    if choices := data.choices:
 								                        if chunk := choices[0].get("delta", {}).get("content"):
 								                            print(chunk, end="", flush=True)
 								                            yield chunk
-												fix api & webui: 1.add logs, 2. check json response, 3. set timeout=False in recreate_vector_stoore

											
										
										
											2023-08-15 14:24:54 +08:00
+								            else:
-												增加数据库字段，重建知识库使用多线程 (#1280)

* close #1172: 给webui_page/utils添加一些log信息，方便定位错误

* 修复：重建知识库时页面未实时显示进度

* skip model_worker running when using online model api such as chatgpt

* 修改知识库管理相关内容:
1.KnowledgeFileModel增加3个字段：file_mtime(文件修改时间),file_size(文件大小),custom_docs(是否使用自定义docs)。为后面比对上传文件做准备。
2.给所有String字段加上长度，防止mysql建表错误(pr#1177)
3.统一[faiss/milvus/pgvector]_kb_service.add_doc接口，使其支持自定义docs
4.为faiss_kb_service增加一些方法，便于调用
5.为KnowledgeFile增加一些方法，便于获取文件信息，缓存file2text的结果。

* 修复/chat/fastchat无法流式输出的问题

* 新增功能：
1、KnowledgeFileModel增加"docs_count"字段，代表该文件加载到向量库中的Document数量，并在WEBUI中进行展示。
2、重建知识库`python init_database.py --recreate-vs`支持多线程。

其它：
统一代码中知识库相关函数用词：file代表一个文件名称或路径，doc代表langchain加载后的Document。部分与API接口有关或含义重叠的函数暂未修改。

---------

Co-authored-by: liunux4odoo <liunux@qq.com>, hongkong9771 
											
										
										
											2023-08-28 13:50:35 +08:00
+								                if response.choices:
 								                    answer = response.choices[0].message.content
 								                    print(answer)
 								                    yield(answer)
-												fix api & webui: 1.add logs, 2. check json response, 3. set timeout=False in recreate_vector_stoore

											
										
										
											2023-08-15 14:24:54 +08:00
+								        except Exception as e:
-												增加显示详细日志开关

											
										
										
											2023-09-08 20:48:31 +08:00
+								            msg = f"获取ChatCompletion时出错：{e}"
 								            logger.error(f'{e.__class__.__name__}: {msg}',
 								                         exc_info=e if log_verbose else None)
-												fix api & webui: 1.add logs, 2. check json response, 3. set timeout=False in recreate_vector_stoore

											
										
										
											2023-08-15 14:24:54 +08:00
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								    return StreamingResponse(
-												修改server.chat.openai_chat中的参数定义，使其与openai中/v1/chat/completions接口的入参保持一致，并按照model_config提供默认值。
openai_chat中的接口还要修改：openai根据参数stream有不同的返回值，本接口要与其对应。

											
										
										
											2023-07-30 08:56:49 +08:00
+								        get_response(msg),
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								        media_type='text/event-stream',
-												修改server.chat.openai_chat中的参数定义，使其与openai中/v1/chat/completions接口的入参保持一致，并按照model_config提供默认值。
openai_chat中的接口还要修改：openai根据参数stream有不同的返回值，本接口要与其对应。

											
										
										
											2023-07-30 08:56:49 +08:00
+								    )