Merge pull request #2173 from chatchat-space/hzg0601-patch-4

Update startup.py
2023-11-25 19:45:13 +08:00 · 2023-11-25 19:45:13 +08:00 · 92dcb11b26
parent 717355bf1e abb32722fe
commit 92dcb11b26
1 changed files with 4 additions and 2 deletions
--- a/startup.py
+++ b/startup.py
@ -137,7 +137,9 @@ def create_model_worker_app(log_level: str = "INFO", **kwargs) -> FastAPI:
            args.quantization = None
            args.max_log_len = None
            args.tokenizer_revision = None
-
+            # 0.2.2 vllm需要新加的参数
            args.max_paddings = 256
            if args.model_path:
                args.model = args.model_path
            if args.num_gpus > 1:
@ -161,7 +163,7 @@ def create_model_worker_app(log_level: str = "INFO", **kwargs) -> FastAPI:
                        conv_template = args.conv_template,
                        )
            sys.modules["fastchat.serve.vllm_worker"].engine = engine
-            # sys.modules["fastchat.serve.vllm_worker"].worker = worker
+            sys.modules["fastchat.serve.vllm_worker"].worker = worker
            sys.modules["fastchat.serve.vllm_worker"].logger.setLevel(log_level)
        else: