Langchain-Chatchat/server/llm_api.py

from fastapi import Body
from configs import logger, log_verbose, LLM_MODEL, HTTPX_DEFAULT_TIMEOUT
from server.utils import BaseResponse, fschat_controller_address, list_llm_models
import httpx


def list_running_models(
    controller_address: str = Body(None, description="Fastchat controller服务器地址", examples=[fschat_controller_address()]),
    placeholder: str = Body(None, description="该参数未使用，占位用"),
) -> BaseResponse:
    '''
    从fastchat controller获取已加载模型列表
    '''
    try:
        controller_address = controller_address or fschat_controller_address()
        r = httpx.post(controller_address + "/list_models")
        return BaseResponse(data=r.json()["models"])
    except Exception as e:
        logger.error(f'{e.__class__.__name__}: {e}',
                        exc_info=e if log_verbose else None)
        return BaseResponse(
            code=500,
            data=[],
            msg=f"failed to get available models from controller: {controller_address}。错误信息是： {e}")


def list_config_models() -> BaseResponse:
    '''
    从本地获取configs中配置的模型列表
    '''
    return BaseResponse(data=list_llm_models())


def stop_llm_model(
    model_name: str = Body(..., description="要停止的LLM模型名称", examples=[LLM_MODEL]),
    controller_address: str = Body(None, description="Fastchat controller服务器地址", examples=[fschat_controller_address()])
) -> BaseResponse:
    '''
    向fastchat controller请求停止某个LLM模型。
    注意：由于Fastchat的实现方式，实际上是把LLM模型所在的model_worker停掉。
    '''
    try:
        controller_address = controller_address or fschat_controller_address()
        r = httpx.post(
            controller_address + "/release_worker",
            json={"model_name": model_name},
        )
        return r.json()
    except Exception as e:
        logger.error(f'{e.__class__.__name__}: {e}',
                        exc_info=e if log_verbose else None)
        return BaseResponse(
            code=500,
            msg=f"failed to stop LLM model {model_name} from controller: {controller_address}。错误信息是： {e}")


def change_llm_model(
    model_name: str = Body(..., description="当前运行模型", examples=[LLM_MODEL]),
    new_model_name: str = Body(..., description="要切换的新模型", examples=[LLM_MODEL]),
    controller_address: str = Body(None, description="Fastchat controller服务器地址", examples=[fschat_controller_address()])
):
    '''
    向fastchat controller请求切换LLM模型。
    '''
    try:
        controller_address = controller_address or fschat_controller_address()
        r = httpx.post(
            controller_address + "/release_worker",
            json={"model_name": model_name, "new_model_name": new_model_name},
            timeout=HTTPX_DEFAULT_TIMEOUT, # wait for new worker_model
        )
        return r.json()
    except Exception as e:
        logger.error(f'{e.__class__.__name__}: {e}',
                        exc_info=e if log_verbose else None)
        return BaseResponse(
            code=500,
            msg=f"failed to switch LLM model from controller: {controller_address}。错误信息是： {e}")
-												修改Embeddings和FAISS缓存加载方式，知识库相关API接口支持多线程并发 (#1434)

* 修改Embeddings和FAISS缓存加载方式，支持多线程，支持内存FAISS

* 知识库相关API接口支持多线程并发

* 根据新的API接口调整ApiRequest和测试用例

* 删除webui.py失效的启动说明
											
										
										
											2023-09-11 20:41:41 +08:00
+								from fastapi import Body
 								from configs import logger, log_verbose, LLM_MODEL, HTTPX_DEFAULT_TIMEOUT
-												优化LLM模型列表获取、切换的逻辑： (#1497)

1、更准确的获取未运行的可用模型
2、优化WEBUI模型列表显示与切换的控制逻辑
											
										
										
											2023-09-16 07:15:08 +08:00
+								from server.utils import BaseResponse, fschat_controller_address, list_llm_models
-												修改Embeddings和FAISS缓存加载方式，知识库相关API接口支持多线程并发 (#1434)

* 修改Embeddings和FAISS缓存加载方式，支持多线程，支持内存FAISS

* 知识库相关API接口支持多线程并发

* 根据新的API接口调整ApiRequest和测试用例

* 删除webui.py失效的启动说明
											
										
										
											2023-09-11 20:41:41 +08:00
+								import httpx
-												优化LLM模型列表获取、切换的逻辑： (#1497)

1、更准确的获取未运行的可用模型
2、优化WEBUI模型列表显示与切换的控制逻辑
											
										
										
											2023-09-16 07:15:08 +08:00
+								def list_running_models(
-												fix api and webui: (#1435)

1. fix #1431: 优化知识库问答与搜索引擎问答的API接口，避免docs重复返回
2. startup.py根据configs.log_verbose控制log级别
3. 修复/llm_model/list_models的bug:
   只有一个参数时，fastapi未返回json导致视图函数出错
											
										
										
											2023-09-12 08:31:17 +08:00
+								    controller_address: str = Body(None, description="Fastchat controller服务器地址", examples=[fschat_controller_address()]),
 								    placeholder: str = Body(None, description="该参数未使用，占位用"),
-												修改Embeddings和FAISS缓存加载方式，知识库相关API接口支持多线程并发 (#1434)

* 修改Embeddings和FAISS缓存加载方式，支持多线程，支持内存FAISS

* 知识库相关API接口支持多线程并发

* 根据新的API接口调整ApiRequest和测试用例

* 删除webui.py失效的启动说明
											
										
										
											2023-09-11 20:41:41 +08:00
+								) -> BaseResponse:
 								    '''
 								    从fastchat controller获取已加载模型列表
 								    '''
 								    try:
 								        controller_address = controller_address or fschat_controller_address()
 								        r = httpx.post(controller_address + "/list_models")
 								        return BaseResponse(data=r.json()["models"])
 								    except Exception as e:
 								        logger.error(f'{e.__class__.__name__}: {e}',
 								                        exc_info=e if log_verbose else None)
 								        return BaseResponse(
 								            code=500,
 								            data=[],
 								            msg=f"failed to get available models from controller: {controller_address}。错误信息是： {e}")
-												优化LLM模型列表获取、切换的逻辑： (#1497)

1、更准确的获取未运行的可用模型
2、优化WEBUI模型列表显示与切换的控制逻辑
											
										
										
											2023-09-16 07:15:08 +08:00
+								def list_config_models() -> BaseResponse:
 								    '''
 								    从本地获取configs中配置的模型列表
 								    '''
 								    return BaseResponse(data=list_llm_models())
-												修改Embeddings和FAISS缓存加载方式，知识库相关API接口支持多线程并发 (#1434)

* 修改Embeddings和FAISS缓存加载方式，支持多线程，支持内存FAISS

* 知识库相关API接口支持多线程并发

* 根据新的API接口调整ApiRequest和测试用例

* 删除webui.py失效的启动说明
											
										
										
											2023-09-11 20:41:41 +08:00
+								def stop_llm_model(
 								    model_name: str = Body(..., description="要停止的LLM模型名称", examples=[LLM_MODEL]),
 								    controller_address: str = Body(None, description="Fastchat controller服务器地址", examples=[fschat_controller_address()])
 								) -> BaseResponse:
 								    '''
 								    向fastchat controller请求停止某个LLM模型。
 								    注意：由于Fastchat的实现方式，实际上是把LLM模型所在的model_worker停掉。
 								    '''
 								    try:
 								        controller_address = controller_address or fschat_controller_address()
 								        r = httpx.post(
 								            controller_address + "/release_worker",
 								            json={"model_name": model_name},
-												llm_api can be terminated by Ctrl+c. success on windows

											
										
										
											2023-08-16 17:48:55 +08:00
+								        )
-												修改Embeddings和FAISS缓存加载方式，知识库相关API接口支持多线程并发 (#1434)

* 修改Embeddings和FAISS缓存加载方式，支持多线程，支持内存FAISS

* 知识库相关API接口支持多线程并发

* 根据新的API接口调整ApiRequest和测试用例

* 删除webui.py失效的启动说明
											
										
										
											2023-09-11 20:41:41 +08:00
+								        return r.json()
 								    except Exception as e:
 								        logger.error(f'{e.__class__.__name__}: {e}',
 								                        exc_info=e if log_verbose else None)
 								        return BaseResponse(
 								            code=500,
 								            msg=f"failed to stop LLM model {model_name} from controller: {controller_address}。错误信息是： {e}")
 								def change_llm_model(
 								    model_name: str = Body(..., description="当前运行模型", examples=[LLM_MODEL]),
 								    new_model_name: str = Body(..., description="要切换的新模型", examples=[LLM_MODEL]),
 								    controller_address: str = Body(None, description="Fastchat controller服务器地址", examples=[fschat_controller_address()])
-												use multiprocessing to run fastchat server

											
										
										
											2023-07-29 23:01:24 +08:00
+								):
-												修改Embeddings和FAISS缓存加载方式，知识库相关API接口支持多线程并发 (#1434)

* 修改Embeddings和FAISS缓存加载方式，支持多线程，支持内存FAISS

* 知识库相关API接口支持多线程并发

* 根据新的API接口调整ApiRequest和测试用例

* 删除webui.py失效的启动说明
											
										
										
											2023-09-11 20:41:41 +08:00
+								    '''
 								    向fastchat controller请求切换LLM模型。
 								    '''
 								    try:
 								        controller_address = controller_address or fschat_controller_address()
 								        r = httpx.post(
 								            controller_address + "/release_worker",
 								            json={"model_name": model_name, "new_model_name": new_model_name},
 								            timeout=HTTPX_DEFAULT_TIMEOUT, # wait for new worker_model
-												llm_api can be terminated by Ctrl+c. success on windows

											
										
										
											2023-08-16 17:48:55 +08:00
+								        )
-												修改Embeddings和FAISS缓存加载方式，知识库相关API接口支持多线程并发 (#1434)

* 修改Embeddings和FAISS缓存加载方式，支持多线程，支持内存FAISS

* 知识库相关API接口支持多线程并发

* 根据新的API接口调整ApiRequest和测试用例

* 删除webui.py失效的启动说明
											
										
										
											2023-09-11 20:41:41 +08:00
+								        return r.json()
 								    except Exception as e:
 								        logger.error(f'{e.__class__.__name__}: {e}',
 								                        exc_info=e if log_verbose else None)
 								        return BaseResponse(
 								            code=500,
 								            msg=f"failed to switch LLM model from controller: {controller_address}。错误信息是： {e}")