添加MiniMax在线API支持 (#1445)

2023-09-12 15:24:47 +08:00 · 2023-09-12 15:24:47 +08:00 · 03c021d50f
parent 60f88ae92e
commit 03c021d50f
6 changed files with 128 additions and 4 deletions
--- a/configs/model_config.py.example
+++ b/configs/model_config.py.example
@ -88,6 +88,14 @@ llm_model_dict = {
        "provider": "ChatGLMWorker",
        "version": "chatglm_pro",  # 可选包括 "chatglm_lite", "chatglm_std", "chatglm_pro"
    },
 "minimax-api": {
        "api_base_url": "http://127.0.0.1:8888/v1",
        "group_id": "",
        "api_key": "",
        "is_pro": False,
        "provider": "MiniMaxWorker",
    },
 }
 # LLM 名称
--- a/configs/server_config.py.example
+++ b/configs/server_config.py.example
@ -66,6 +66,9 @@ FSCHAT_MODEL_WORKERS = {
    "chatglm-api": { # 请为每个在线API设置不同的端口
        "port": 20003,
    },
    "minimax-api": { # 请为每个在线API设置不同的端口
        "port": 20004,
    },
 }
 # fastchat multi model worker server
--- a/server/model_workers/init.py
+++ b/server/model_workers/init.py
@ -1 +1,2 @@
 from .zhipu import ChatGLMWorker
 from .minimax import MiniMaxWorker
--- a/server/model_workers/base.py
+++ b/server/model_workers/base.py
@ -69,3 +69,8 @@ class ApiModelWorker(BaseModelWorker):
            target=fastchat.serve.model_worker.heart_beat_worker, args=(self,), daemon=True,
        )
        self.heart_beat_thread.start()
    # help methods
    def get_config(self):
        from server.utils import get_model_worker_config
        return get_model_worker_config(self.model_names[0])
--- a/server/model_workers/minimax.py
+++ b/server/model_workers/minimax.py
@ -0,0 +1,108 @@
 from server.model_workers.base import ApiModelWorker
 from fastchat import conversation as conv
 import sys
 import json
 import httpx
 from pprint import pprint
 from typing import List, Dict
 class MiniMaxWorker(ApiModelWorker):
    BASE_URL = 'https://api.minimax.chat/v1/text/chatcompletion{pro}?GroupId={group_id}'
    def __init__(
        self,
        *,
        model_names: List[str] = ["minimax-api"],
        controller_addr: str,
        worker_addr: str,
        **kwargs,
    ):
        kwargs.update(model_names=model_names, controller_addr=controller_addr, worker_addr=worker_addr)
        kwargs.setdefault("context_len", 16384)
        super().__init__(**kwargs)
        # TODO: 确认模板是否需要修改
        self.conv = conv.Conversation(
            name=self.model_names[0],
            system_message="",
            messages=[],
            roles=["USER", "BOT"],
            sep="\n### ",
            stop_str="###",
        )
    def prompt_to_messages(self, prompt: str) -> List[Dict]:
        result = []
        user_start = self.conv.roles[0] + ":"
        bot_start = self.conv.roles[1] + ":"
        for msg in prompt.split(self.conv.sep)[1:-1]:
            if msg.startswith(user_start):
                result.append({"sender_type": "USER", "text": msg[len(user_start):].strip()})
            elif msg.startswith(bot_start):
                result.append({"sender_type": "BOT", "text": msg[len(bot_start)].strip()})
            else:
                raise RuntimeError(f"unknow role in msg: {msg}")
        return result
    def generate_stream_gate(self, params):
        # 按照官网推荐，直接调用abab 5.5模型
        # TODO: 支持历史消息，支持指定回复要求，支持指定用户名称、AI名称
        super().generate_stream_gate(params)
        config = self.get_config()
        group_id = config.get("group_id")
        api_key = config.get("api_key")
        pro = "_pro" if config.get("is_pro") else ""
        headers = {
            "Authorization": f"Bearer {api_key}",
            "Content-Type": "application/json",
        }
        data = {
            "model": "abab5.5-chat",
            "stream": True,
            "tokens_to_generate": 1024, # TODO: 1024为官网默认值
            "mask_sensitive_info": True,
            "messages": self.prompt_to_messages(params["prompt"]),
            "temperature": params.get("temperature"),
            "top_p": params.get("top_p"),
            "bot_setting": [],
        }
        print("request data sent to minimax:")
        pprint(data)
        response = httpx.stream("POST",
                                self.BASE_URL.format(pro=pro, group_id=group_id),
                                headers=headers,
                                json=data)
        with response as r:
            text = ""
            for e in r.iter_text():
                if e.startswith("data: "): # 真是优秀的返回
                    data = json.loads(e[6:])
                    if not data.get("usage"):
                        if choices := data.get("choices"):
                            chunk = choices[0].get("delta", "").strip()
                            if chunk:
                                print(chunk)
                                text += chunk
                                yield json.dumps({"error_code": 0, "text": text}, ensure_ascii=False).encode() + b"\0"
    def get_embeddings(self, params):
        # TODO: 支持embeddings
        print("embedding")
        print(params)
 if __name__ == "__main__":
    import uvicorn
    from server.utils import MakeFastAPIOffline
    from fastchat.serve.model_worker import app
    worker = MiniMaxWorker(
        controller_addr="http://127.0.0.1:20001",
        worker_addr="http://127.0.0.1:20004",
    )
    sys.modules["fastchat.serve.model_worker"].worker = worker
    MakeFastAPIOffline(app)
    uvicorn.run(app, port=20003)
--- a/server/model_workers/zhipu.py
+++ b/server/model_workers/zhipu.py
@ -25,7 +25,7 @@ class ChatGLMWorker(ApiModelWorker):
        # 这里的是chatglm api的模板，其它API的conv_template需要定制
        self.conv = conv.Conversation(
-            name="chatglm-api",
+            name=self.model_names[0],
            system_message="你是一个聪明、对人类有帮助的人工智能，你可以对人类提出的问题给出有用、详细、礼貌的回答。",
            messages=[],
            roles=["Human", "Assistant"],
@ -34,12 +34,11 @@ class ChatGLMWorker(ApiModelWorker):
        )
    def generate_stream_gate(self, params):
-        # TODO: 支持stream参数，维护request_id，传过来的prompt也有问题
+        # TODO: 维护request_id
        from server.utils import get_model_worker_config
        import zhipuai
        super().generate_stream_gate(params)
-        zhipuai.api_key = get_model_worker_config("chatglm-api").get("api_key")
+        zhipuai.api_key = self.get_config().get("api_key")
        response = zhipuai.model_api.sse_invoke(
            model=self.version,
`@ -1 +1,2 @@`
	`from .zhipu import ChatGLMWorker`	`from .zhipu import ChatGLMWorker`
		`from .minimax import MiniMaxWorker`