Langchain-Chatchat/configs/model_config.py

import torch.cuda
import torch.backends
import os
import logging
import uuid

LOG_FORMAT = "%(levelname) -5s %(asctime)s" "-1d: %(message)s"
logger = logging.getLogger()
logger.setLevel(logging.INFO)
logging.basicConfig(format=LOG_FORMAT)

# 在以下字典中修改属性值，以指定本地embedding模型存储位置
# 如将 "text2vec": "GanymedeNil/text2vec-large-chinese" 修改为 "text2vec": "User/Downloads/text2vec-large-chinese"
# 此处请写绝对路径
embedding_model_dict = {
    "ernie-tiny": "nghuyong/ernie-3.0-nano-zh",
    "ernie-base": "nghuyong/ernie-3.0-base-zh",
    "text2vec-base": "shibing624/text2vec-base-chinese",
    "text2vec": "GanymedeNil/text2vec-large-chinese",
    "m3e-small": "moka-ai/m3e-small",
    "m3e-base": "moka-ai/m3e-base",
}

# Embedding model name
EMBEDDING_MODEL = "text2vec"

# Embedding running device
EMBEDDING_DEVICE = "cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu"

# supported LLM models
# llm_model_dict 处理了loader的一些预设行为，如加载位置，模型名称，模型处理器实例
# 在以下字典中修改属性值，以指定本地 LLM 模型存储位置
# 如将 "chatglm-6b" 的 "local_model_path" 由 None 修改为 "User/Downloads/chatglm-6b"
# 此处请写绝对路径
llm_model_dict = {
    "chatglm-6b-int4-qe": {
        "name": "chatglm-6b-int4-qe",
        "pretrained_model_name": "THUDM/chatglm-6b-int4-qe",
        "local_model_path": None,
        "provides": "ChatGLMLLMChain"
    },
    "chatglm-6b-int4": {
        "name": "chatglm-6b-int4",
        "pretrained_model_name": "THUDM/chatglm-6b-int4",
        "local_model_path": None,
        "provides": "ChatGLMLLMChain"
    },
    "chatglm-6b-int8": {
        "name": "chatglm-6b-int8",
        "pretrained_model_name": "THUDM/chatglm-6b-int8",
        "local_model_path": None,
        "provides": "ChatGLMLLMChain"
    },
    "chatglm-6b": {
        "name": "chatglm-6b",
        "pretrained_model_name": "THUDM/chatglm-6b",
        "local_model_path": None,
        "provides": "ChatGLMLLMChain"
    },
    "chatglm2-6b": {
        "name": "chatglm2-6b",
        "pretrained_model_name": "THUDM/chatglm2-6b",
        "local_model_path": None,
        "provides": "ChatGLMLLMChain"
    },
    "chatglm2-6b-int4": {
        "name": "chatglm2-6b-int4",
        "pretrained_model_name": "THUDM/chatglm2-6b-int4",
        "local_model_path": None,
        "provides": "ChatGLMLLMChain"
    },
    "chatglm2-6b-int8": {
        "name": "chatglm2-6b-int8",
        "pretrained_model_name": "THUDM/chatglm2-6b-int8",
        "local_model_path": None,
        "provides": "ChatGLMLLMChain"
    },
    "chatyuan": {
        "name": "chatyuan",
        "pretrained_model_name": "ClueAI/ChatYuan-large-v2",
        "local_model_path": None,
        "provides": "MOSSLLMChain"
    },
    "moss": {
        "name": "moss",
        "pretrained_model_name": "fnlp/moss-moon-003-sft",
        "local_model_path": None,
        "provides": "MOSSLLMChain"
    },
    "moss-int4": {
        "name": "moss",
        "pretrained_model_name": "fnlp/moss-moon-003-sft-int4",
        "local_model_path": None,
        "provides": "MOSSLLM"
    },
    "vicuna-13b-hf": {
        "name": "vicuna-13b-hf",
        "pretrained_model_name": "vicuna-13b-hf",
        "local_model_path": None,
        "provides": "LLamaLLMChain"
    },
    "vicuna-7b-hf": {
        "name": "vicuna-13b-hf",
        "pretrained_model_name": "vicuna-13b-hf",
        "local_model_path": None,
        "provides": "LLamaLLMChain"
    },
    # 直接调用返回requests.exceptions.ConnectionError错误，需要通过huggingface_hub包里的snapshot_download函数
    # 下载模型，如果snapshot_download还是返回网络错误，多试几次，一般是可以的，
    # 如果仍然不行，则应该是网络加了防火墙(在服务器上这种情况比较常见)，基本只能从别的设备上下载，
    # 然后转移到目标设备了.
    "bloomz-7b1": {
        "name": "bloomz-7b1",
        "pretrained_model_name": "bigscience/bloomz-7b1",
        "local_model_path": None,
        "provides": "MOSSLLMChain"

    },
    # 实测加载bigscience/bloom-3b需要170秒左右，暂不清楚为什么这么慢
    # 应与它要加载专有token有关
    "bloom-3b": {
        "name": "bloom-3b",
        "pretrained_model_name": "bigscience/bloom-3b",
        "local_model_path": None,
        "provides": "MOSSLLMChain"

    },
    "baichuan-7b": {
        "name": "baichuan-7b",
        "pretrained_model_name": "baichuan-inc/baichuan-7B",
        "local_model_path": None,
        "provides": "MOSSLLMChain"
    },
    # llama-cpp模型的兼容性问题参考https://github.com/abetlen/llama-cpp-python/issues/204
    "ggml-vicuna-13b-1.1-q5": {
        "name": "ggml-vicuna-13b-1.1-q5",
        "pretrained_model_name": "lmsys/vicuna-13b-delta-v1.1",
        # 这里需要下载好模型的路径,如果下载模型是默认路径则它会下载到用户工作区的
        # /.cache/huggingface/hub/models--vicuna--ggml-vicuna-13b-1.1/
        # 还有就是由于本项目加载模型的方式设置的比较严格，下载完成后仍需手动修改模型的文件名
        # 将其设置为与Huggface Hub一致的文件名
        # 此外不同时期的ggml格式并不兼容，因此不同时期的ggml需要安装不同的llama-cpp-python库，且实测pip install 不好使
        # 需要手动从https://github.com/abetlen/llama-cpp-python/releases/tag/下载对应的wheel安装
        # 实测v0.1.63与本模型的vicuna/ggml-vicuna-13b-1.1/ggml-vic13b-q5_1.bin可以兼容
        "local_model_path": f'''{"/".join(os.path.abspath(__file__).split("/")[:3])}/.cache/huggingface/hub/models--vicuna--ggml-vicuna-13b-1.1/blobs/''',
        "provides": "LLamaLLMChain"
    },

    # 通过 fastchat 调用的模型请参考如下格式
    "fastchat-chatglm-6b": {
        "name": "chatglm-6b",  # "name"修改为fastchat服务中的"model_name"
        "pretrained_model_name": "chatglm-6b",
        "local_model_path": None,
        "provides": "FastChatOpenAILLMChain",  # 使用fastchat api时，需保证"provides"为"FastChatOpenAILLMChain"
        "api_base_url": "http://localhost:8000/v1",  # "name"修改为fastchat服务中的"api_base_url"
        "api_key": "EMPTY"
    },
    "fastchat-chatglm2-6b": {
        "name": "chatglm2-6b",  # "name"修改为fastchat服务中的"model_name"
        "pretrained_model_name": "chatglm2-6b",
        "local_model_path": None,
        "provides": "FastChatOpenAILLMChain",  # 使用fastchat api时，需保证"provides"为"FastChatOpenAILLMChain"
        "api_base_url": "http://localhost:8000/v1"  # "name"修改为fastchat服务中的"api_base_url"
    },

    # 通过 fastchat 调用的模型请参考如下格式
    "fastchat-vicuna-13b-hf": {
        "name": "vicuna-13b-hf",  # "name"修改为fastchat服务中的"model_name"
        "pretrained_model_name": "vicuna-13b-hf",
        "local_model_path": None,
        "provides": "FastChatOpenAILLMChain",  # 使用fastchat api时，需保证"provides"为"FastChatOpenAILLMChain"
        "api_base_url": "http://localhost:8000/v1",  # "name"修改为fastchat服务中的"api_base_url"
        "api_key": "EMPTY"
    },
    # 调用chatgpt时如果报出： urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='api.openai.com', port=443):
    #  Max retries exceeded with url: /v1/chat/completions
    # 则需要将urllib3版本修改为1.25.11

    # 如果报出：raise NewConnectionError(
    # urllib3.exceptions.NewConnectionError: <urllib3.connection.HTTPSConnection object at 0x000001FE4BDB85E0>:
    # Failed to establish a new connection: [WinError 10060]
    # 则是因为内地和香港的IP都被OPENAI封了，需要挂切换为日本、新加坡等地
    "openai-chatgpt-3.5": {
        "name": "gpt-3.5-turbo",
        "pretrained_model_name": "gpt-3.5-turbo",
        "provides": "FastChatOpenAILLMChain",
        "local_model_path": None,
        "api_base_url": "https://api.openapi.com/v1",
        "api_key": ""
    },

}

# LLM 名称
LLM_MODEL = "chatglm-6b"
# 量化加载8bit 模型
LOAD_IN_8BIT = False
# Load the model with bfloat16 precision. Requires NVIDIA Ampere GPU.
BF16 = False
# 本地lora存放的位置
LORA_DIR = "loras/"

# LLM lora path，默认为空，如果有请直接指定文件夹路径
LLM_LORA_PATH = ""
USE_LORA = True if LLM_LORA_PATH else False

# LLM streaming reponse
STREAMING = True

# Use p-tuning-v2 PrefixEncoder
USE_PTUNING_V2 = False
PTUNING_DIR='./ptuing-v2'
<<<<<<< HEAD
=======

>>>>>>> f68d347c25b4bdd07f293c65a6e44a673a11f614
# LLM running device
LLM_DEVICE = "cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu"

# 知识库默认存储路径
KB_ROOT_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "knowledge_base")

# 基于上下文的prompt模版，请务必保留"{question}"和"{context}"
PROMPT_TEMPLATE = """已知信息：
{context} 

根据上述已知信息，简洁和专业的来回答用户的问题。如果无法从中得到答案，请说 “根据已知信息无法回答该问题” 或 “没有提供足够的相关信息”，不允许在答案中添加编造成分，答案请使用中文。 问题是：{question}"""

# 缓存知识库数量,如果是ChatGLM2,ChatGLM2-int4,ChatGLM2-int8模型若检索效果不好可以调成’10’
CACHED_VS_NUM = 1

# 文本分句长度
SENTENCE_SIZE = 100

# 匹配后单段上下文长度
CHUNK_SIZE = 250

# 传入LLM的历史记录长度
LLM_HISTORY_LEN = 3

# 知识库检索时返回的匹配内容条数
VECTOR_SEARCH_TOP_K = 5

# 知识检索内容相关度 Score, 数值范围约为0-1100，如果为0，则不生效，经测试设置为小于500时，匹配结果更精准
VECTOR_SEARCH_SCORE_THRESHOLD = 390

NLTK_DATA_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "nltk_data")

FLAG_USER_NAME = uuid.uuid4().hex

logger.info(f"""
loading model config
llm device: {LLM_DEVICE}
embedding device: {EMBEDDING_DEVICE}
dir: {os.path.dirname(os.path.dirname(__file__))}
flagging username: {FLAG_USER_NAME}
""")

# 是否开启跨域，默认为False，如果需要开启，请设置为True
# is open cross domain
OPEN_CROSS_DOMAIN = False

# Bing 搜索必备变量
# 使用 Bing 搜索需要使用 Bing Subscription Key,需要在azure port中申请试用bing search
# 具体申请方式请见
# https://learn.microsoft.com/en-us/bing/search-apis/bing-web-search/create-bing-search-service-resource
# 使用python创建bing api 搜索实例详见:
# https://learn.microsoft.com/en-us/bing/search-apis/bing-web-search/quickstarts/rest/python
BING_SEARCH_URL = "https://api.bing.microsoft.com/v7.0/search"
# 注意不是bing Webmaster Tools的api key，

# 此外，如果是在服务器上，报Failed to establish a new connection: [Errno 110] Connection timed out
# 是因为服务器加了防火墙，需要联系管理员加白名单，如果公司的服务器的话，就别想了GG
BING_SUBSCRIPTION_KEY = ""

# 是否开启中文标题加强，以及标题增强的相关配置
# 通过增加标题判断，判断哪些文本为标题，并在metadata中进行标记；
# 然后将文本与往上一级的标题进行拼合，实现文本信息的增强。
ZH_TITLE_ENHANCE = False
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
+								import torch.cuda
 								import torch.backends
-												update model_config.py

											
										
										
											2023-04-25 20:14:33 +08:00
+								import os
-												logging: 格式日志输出 (#268)

* logging: 统一日志格式输出

---------

Co-authored-by: Bob Chang <bob.chang@amway.com>
Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-05-08 18:29:09 +08:00
+								import logging
 								import uuid
 								LOG_FORMAT = "%(levelname) -5s %(asctime)s" "-1d: %(message)s"
 								logger = logging.getLogger()
 								logger.setLevel(logging.INFO)
 								logging.basicConfig(format=LOG_FORMAT)
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
-												updata model_config.py

											
										
										
											2023-06-12 00:10:47 +08:00
+								# 在以下字典中修改属性值，以指定本地embedding模型存储位置
 								# 如将 "text2vec": "GanymedeNil/text2vec-large-chinese" 修改为 "text2vec": "User/Downloads/text2vec-large-chinese"
 								# 此处请写绝对路径
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
+								embedding_model_dict = {
 								    "ernie-tiny": "nghuyong/ernie-3.0-nano-zh",
 								    "ernie-base": "nghuyong/ernie-3.0-base-zh",
-												update model_config.py

											
										
										
											2023-04-27 07:40:57 +08:00
+								    "text2vec-base": "shibing624/text2vec-base-chinese",
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
+								    "text2vec": "GanymedeNil/text2vec-large-chinese",
-												add support for new embedding models: moka-ai/m3e-base and moka-ai/m3e-small

											
										
										
											2023-06-09 19:04:34 +08:00
+								    "m3e-small": "moka-ai/m3e-small",
 								    "m3e-base": "moka-ai/m3e-base",
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
+								}
 								# Embedding model name
-												update cli_demo.py

											
										
										
											2023-04-13 23:20:45 +08:00
+								EMBEDDING_MODEL = "text2vec"
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
 								# Embedding running device
 								EMBEDDING_DEVICE = "cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu"
 								# supported LLM models
-												update loaders

											
										
										
											2023-05-22 00:15:29 +08:00
+								# llm_model_dict 处理了loader的一些预设行为，如加载位置，模型名称，模型处理器实例
-												updata model_config.py

											
										
										
											2023-06-12 00:10:47 +08:00
+								# 在以下字典中修改属性值，以指定本地 LLM 模型存储位置
 								# 如将 "chatglm-6b" 的 "local_model_path" 由 None 修改为 "User/Downloads/chatglm-6b"
 								# 此处请写绝对路径
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
+								llm_model_dict = {
-												llm_model_dict 处理了loader的一些预设行为，如加载位置，模型名称，模型处理器实例, 定义checkpoint名称和远程路径
loader.py: 模型重载
定义 generatorAnswer 增加 AnswerResultStream
   定义generate_with_callback收集器，在每次响应时将队列数据同步到AnswerResult
requirements.txt 变更项目依赖

											
										
										
											2023-05-18 22:54:41 +08:00
+								    "chatglm-6b-int4-qe": {
 								        "name": "chatglm-6b-int4-qe",
-												update model_config.py

											
										
										
											2023-05-19 23:12:39 +08:00
+								        "pretrained_model_name": "THUDM/chatglm-6b-int4-qe",
 								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "ChatGLMLLMChain"
-												llm_model_dict 处理了loader的一些预设行为，如加载位置，模型名称，模型处理器实例, 定义checkpoint名称和远程路径
loader.py: 模型重载
定义 generatorAnswer 增加 AnswerResultStream
   定义generate_with_callback收集器，在每次响应时将队列数据同步到AnswerResult
requirements.txt 变更项目依赖

											
										
										
											2023-05-18 22:54:41 +08:00
+								    },
 								    "chatglm-6b-int4": {
 								        "name": "chatglm-6b-int4",
-												update model_config.py

											
										
										
											2023-05-19 23:12:39 +08:00
+								        "pretrained_model_name": "THUDM/chatglm-6b-int4",
 								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "ChatGLMLLMChain"
-												llm_model_dict 处理了loader的一些预设行为，如加载位置，模型名称，模型处理器实例, 定义checkpoint名称和远程路径
loader.py: 模型重载
定义 generatorAnswer 增加 AnswerResultStream
   定义generate_with_callback收集器，在每次响应时将队列数据同步到AnswerResult
requirements.txt 变更项目依赖

											
										
										
											2023-05-18 22:54:41 +08:00
+								    },
-												update model_config.py

											
										
										
											2023-05-19 23:16:39 +08:00
+								    "chatglm-6b-int8": {
 								        "name": "chatglm-6b-int8",
 								        "pretrained_model_name": "THUDM/chatglm-6b-int8",
 								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "ChatGLMLLMChain"
-												update model_config.py

											
										
										
											2023-05-19 23:16:39 +08:00
+								    },
-												llm_model_dict 处理了loader的一些预设行为，如加载位置，模型名称，模型处理器实例, 定义checkpoint名称和远程路径
loader.py: 模型重载
定义 generatorAnswer 增加 AnswerResultStream
   定义generate_with_callback收集器，在每次响应时将队列数据同步到AnswerResult
requirements.txt 变更项目依赖

											
										
										
											2023-05-18 22:54:41 +08:00
+								    "chatglm-6b": {
 								        "name": "chatglm-6b",
-												update model_config.py

											
										
										
											2023-05-19 23:16:39 +08:00
+								        "pretrained_model_name": "THUDM/chatglm-6b",
-												updata model_config.py

											
										
										
											2023-06-12 00:10:47 +08:00
+								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "ChatGLMLLMChain"
-												llm_model_dict 处理了loader的一些预设行为，如加载位置，模型名称，模型处理器实例, 定义checkpoint名称和远程路径
loader.py: 模型重载
定义 generatorAnswer 增加 AnswerResultStream
   定义generate_with_callback收集器，在每次响应时将队列数据同步到AnswerResult
requirements.txt 变更项目依赖

											
										
										
											2023-05-18 22:54:41 +08:00
+								    },
-												Add chatglm2-6b configs

											
										
										
											2023-06-25 17:04:16 +08:00
+								    "chatglm2-6b": {
 								        "name": "chatglm2-6b",
 								        "pretrained_model_name": "THUDM/chatglm2-6b",
 								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "ChatGLMLLMChain"
-												Add chatglm2-6b configs

											
										
										
											2023-06-25 17:04:16 +08:00
+								    },
-												Update model_config.py (#768)

添加ChatGLM2-6b-int4和ChatGLM2-6b-int8
											
										
										
											2023-07-04 19:04:57 +08:00
+								    "chatglm2-6b-int4": {
 								        "name": "chatglm2-6b-int4",
 								        "pretrained_model_name": "THUDM/chatglm2-6b-int4",
 								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "ChatGLMLLMChain"
-												Update model_config.py (#768)

添加ChatGLM2-6b-int4和ChatGLM2-6b-int8
											
										
										
											2023-07-04 19:04:57 +08:00
+								    },
 								    "chatglm2-6b-int8": {
 								        "name": "chatglm2-6b-int8",
 								        "pretrained_model_name": "THUDM/chatglm2-6b-int8",
 								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "ChatGLMLLMChain"
-												Update model_config.py (#768)

添加ChatGLM2-6b-int4和ChatGLM2-6b-int8
											
										
										
											2023-07-04 19:04:57 +08:00
+								    },
-												llm_model_dict 处理了loader的一些预设行为，如加载位置，模型名称，模型处理器实例, 定义checkpoint名称和远程路径
loader.py: 模型重载
定义 generatorAnswer 增加 AnswerResultStream
   定义generate_with_callback收集器，在每次响应时将队列数据同步到AnswerResult
requirements.txt 变更项目依赖

											
										
										
											2023-05-18 22:54:41 +08:00
+								    "chatyuan": {
 								        "name": "chatyuan",
-												update model_config.py

											
										
										
											2023-05-19 23:12:39 +08:00
+								        "pretrained_model_name": "ClueAI/ChatYuan-large-v2",
 								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "MOSSLLMChain"
-												llm_model_dict 处理了loader的一些预设行为，如加载位置，模型名称，模型处理器实例, 定义checkpoint名称和远程路径
loader.py: 模型重载
定义 generatorAnswer 增加 AnswerResultStream
   定义generate_with_callback收集器，在每次响应时将队列数据同步到AnswerResult
requirements.txt 变更项目依赖

											
										
										
											2023-05-18 22:54:41 +08:00
+								    },
-												update model_config.py

											
										
										
											2023-05-19 23:16:39 +08:00
+								    "moss": {
 								        "name": "moss",
 								        "pretrained_model_name": "fnlp/moss-moon-003-sft",
-												update model_config.py

											
										
										
											2023-05-19 23:12:39 +08:00
+								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "MOSSLLMChain"
-												使用model_config默认配置启动
llama_llm.py 删除流式输出
base.py、shared.py 删除多余代码
fastchat_llm.py 业务实现

											
										
										
											2023-05-23 23:10:31 +08:00
+								    },
-												add ptuning-v2 dir

											
										
										
											2023-07-13 21:22:35 +08:00
+								    "moss-int4": {
 								        "name": "moss",
 								        "pretrained_model_name": "fnlp/moss-moon-003-sft-int4",
 								        "local_model_path": None,
 								        "provides": "MOSSLLM"
 								    },
-												使用model_config默认配置启动
llama_llm.py 删除流式输出
base.py、shared.py 删除多余代码
fastchat_llm.py 业务实现

											
										
										
											2023-05-23 23:10:31 +08:00
+								    "vicuna-13b-hf": {
 								        "name": "vicuna-13b-hf",
 								        "pretrained_model_name": "vicuna-13b-hf",
-												llama_llm.py 提示词修改

											
										
										
											2023-06-13 18:36:07 +08:00
+								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "LLamaLLMChain"
 								    },
 								    "vicuna-7b-hf": {
 								        "name": "vicuna-13b-hf",
 								        "pretrained_model_name": "vicuna-13b-hf",
 								        "local_model_path": None,
 								        "provides": "LLamaLLMChain"
-												update model_config.py

											
										
										
											2023-07-11 20:19:50 +08:00
+								    },
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
+								    # 直接调用返回requests.exceptions.ConnectionError错误，需要通过huggingface_hub包里的snapshot_download函数
 								    # 下载模型，如果snapshot_download还是返回网络错误，多试几次，一般是可以的，
 								    # 如果仍然不行，则应该是网络加了防火墙(在服务器上这种情况比较常见)，基本只能从别的设备上下载，
 								    # 然后转移到目标设备了.
-												update model_config.py

											
										
										
											2023-07-11 20:19:50 +08:00
+								    "bloomz-7b1": {
 								        "name": "bloomz-7b1",
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
+								        "pretrained_model_name": "bigscience/bloomz-7b1",
 								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "MOSSLLMChain"
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
 								    },
 								    # 实测加载bigscience/bloom-3b需要170秒左右，暂不清楚为什么这么慢
 								    # 应与它要加载专有token有关
-												update model_config.py

											
										
										
											2023-07-11 20:19:50 +08:00
+								    "bloom-3b": {
 								        "name": "bloom-3b",
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
+								        "pretrained_model_name": "bigscience/bloom-3b",
 								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "MOSSLLMChain"
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
-												update model_config.py

											
										
										
											2023-07-11 20:19:50 +08:00
+								    },
 								    "baichuan-7b": {
 								        "name": "baichuan-7b",
 								        "pretrained_model_name": "baichuan-inc/baichuan-7B",
 								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "MOSSLLMChain"
-												update model_config.py

											
										
										
											2023-07-11 20:19:50 +08:00
+								    },
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
+								    # llama-cpp模型的兼容性问题参考https://github.com/abetlen/llama-cpp-python/issues/204
-												update model_config.py

											
										
										
											2023-07-11 20:19:50 +08:00
+								    "ggml-vicuna-13b-1.1-q5": {
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
+								        "name": "ggml-vicuna-13b-1.1-q5",
 								        "pretrained_model_name": "lmsys/vicuna-13b-delta-v1.1",
 								        # 这里需要下载好模型的路径,如果下载模型是默认路径则它会下载到用户工作区的
 								        # /.cache/huggingface/hub/models--vicuna--ggml-vicuna-13b-1.1/
 								        # 还有就是由于本项目加载模型的方式设置的比较严格，下载完成后仍需手动修改模型的文件名
 								        # 将其设置为与Huggface Hub一致的文件名
 								        # 此外不同时期的ggml格式并不兼容，因此不同时期的ggml需要安装不同的llama-cpp-python库，且实测pip install 不好使
 								        # 需要手动从https://github.com/abetlen/llama-cpp-python/releases/tag/下载对应的wheel安装
 								        # 实测v0.1.63与本模型的vicuna/ggml-vicuna-13b-1.1/ggml-vic13b-q5_1.bin可以兼容
-												update model_config.py

											
										
										
											2023-07-11 20:19:50 +08:00
+								        "local_model_path": f'''{"/".join(os.path.abspath(__file__).split("/")[:3])}/.cache/huggingface/hub/models--vicuna--ggml-vicuna-13b-1.1/blobs/''',
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "LLamaLLMChain"
-												使用model_config默认配置启动
llama_llm.py 删除流式输出
base.py、shared.py 删除多余代码
fastchat_llm.py 业务实现

											
										
										
											2023-05-23 23:10:31 +08:00
+								    },
-												add fastchat.md

											
										
										
											2023-05-31 22:50:35 +08:00
 								    # 通过 fastchat 调用的模型请参考如下格式
 								    "fastchat-chatglm-6b": {
 								        "name": "chatglm-6b",  # "name"修改为fastchat服务中的"model_name"
 								        "pretrained_model_name": "chatglm-6b",
-												使用model_config默认配置启动
llama_llm.py 删除流式输出
base.py、shared.py 删除多余代码
fastchat_llm.py 业务实现

											
										
										
											2023-05-23 23:10:31 +08:00
+								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "FastChatOpenAILLMChain",  # 使用fastchat api时，需保证"provides"为"FastChatOpenAILLMChain"
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
+								        "api_base_url": "http://localhost:8000/v1",  # "name"修改为fastchat服务中的"api_base_url"
 								        "api_key": "EMPTY"
-												适配远程LLM调用

											
										
										
											2023-05-31 22:11:28 +08:00
+								    },
-												Add chatglm2-6b configs

											
										
										
											2023-06-25 17:04:16 +08:00
+								    "fastchat-chatglm2-6b": {
 								        "name": "chatglm2-6b",  # "name"修改为fastchat服务中的"model_name"
 								        "pretrained_model_name": "chatglm2-6b",
 								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "FastChatOpenAILLMChain",  # 使用fastchat api时，需保证"provides"为"FastChatOpenAILLMChain"
-												Add chatglm2-6b configs

											
										
										
											2023-06-25 17:04:16 +08:00
+								        "api_base_url": "http://localhost:8000/v1"  # "name"修改为fastchat服务中的"api_base_url"
 								    },
-												适配远程LLM调用

											
										
										
											2023-05-31 22:11:28 +08:00
-												add fastchat.md

											
										
										
											2023-05-31 22:50:35 +08:00
+								    # 通过 fastchat 调用的模型请参考如下格式
 								    "fastchat-vicuna-13b-hf": {
 								        "name": "vicuna-13b-hf",  # "name"修改为fastchat服务中的"model_name"
-												适配远程LLM调用

											
										
										
											2023-05-31 22:11:28 +08:00
+								        "pretrained_model_name": "vicuna-13b-hf",
 								        "local_model_path": None,
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "FastChatOpenAILLMChain",  # 使用fastchat api时，需保证"provides"为"FastChatOpenAILLMChain"
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
+								        "api_base_url": "http://localhost:8000/v1",  # "name"修改为fastchat服务中的"api_base_url"
 								        "api_key": "EMPTY"
-												适配远程LLM调用

											
										
										
											2023-05-31 22:11:28 +08:00
+								    },
-												测试OPENAI接口成功 (#813)


											
										
										
											2023-07-11 23:40:49 +08:00
+								    # 调用chatgpt时如果报出： urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='api.openai.com', port=443):
 								    #  Max retries exceeded with url: /v1/chat/completions
 								    # 则需要将urllib3版本修改为1.25.11
 								    # 如果报出：raise NewConnectionError(
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								    # urllib3.exceptions.NewConnectionError: <urllib3.connection.HTTPSConnection object at 0x000001FE4BDB85E0>:
-												测试OPENAI接口成功 (#813)


											
										
										
											2023-07-11 23:40:49 +08:00
+								    # Failed to establish a new connection: [WinError 10060]
 								    # 则是因为内地和香港的IP都被OPENAI封了，需要挂切换为日本、新加坡等地
-												update model_config.py

											
										
										
											2023-07-11 20:19:50 +08:00
+								    "openai-chatgpt-3.5": {
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
+								        "name": "gpt-3.5-turbo",
 								        "pretrained_model_name": "gpt-3.5-turbo",
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								        "provides": "FastChatOpenAILLMChain",
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
+								        "local_model_path": None,
 								        "api_base_url": "https://api.openapi.com/v1",
 								        "api_key": ""
 								    },
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
+								}
-												使用model_config默认配置启动
llama_llm.py 删除流式输出
base.py、shared.py 删除多余代码
fastchat_llm.py 业务实现

											
										
										
											2023-05-23 23:10:31 +08:00
+								# LLM 名称
-												Update model_config.py
											
										
										
											2023-04-21 21:22:25 +08:00
+								LLM_MODEL = "chatglm-6b"
-												使用model_config默认配置启动
llama_llm.py 删除流式输出
base.py、shared.py 删除多余代码
fastchat_llm.py 业务实现

											
										
										
											2023-05-23 23:10:31 +08:00
+								# 量化加载8bit 模型
 								LOAD_IN_8BIT = False
 								# Load the model with bfloat16 precision. Requires NVIDIA Ampere GPU.
 								BF16 = False
 								# 本地lora存放的位置
 								LORA_DIR = "loras/"
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
-												可选择lora权重加载 (#231)

* Add files via upload

增加lora权重使用

* Update model_config.py

* Add files via upload

修复一个小错误，少写了模型加载

* 使用lora微调的权重

使用lora微调的权重

* Update model_config.py
											
										
										
											2023-05-04 21:01:55 +08:00
+								# LLM lora path，默认为空，如果有请直接指定文件夹路径
 								LLM_LORA_PATH = ""
 								USE_LORA = True if LLM_LORA_PATH else False
-												add streaming option in configs/model_config.py

											
										
										
											2023-05-01 17:50:16 +08:00
+								# LLM streaming reponse
 								STREAMING = True
-												Support p-tuning-v2

											
										
										
											2023-04-15 14:43:12 +08:00
+								# Use p-tuning-v2 PrefixEncoder
 								USE_PTUNING_V2 = False
-												支持命令行输入ptuning路径

											
										
										
											2023-07-13 22:10:54 +08:00
+								PTUNING_DIR='./ptuing-v2'
-												add moss-int4

											
										
										
											2023-07-13 22:21:00 +08:00
+								<<<<<<< HEAD
 								=======
-												Support p-tuning-v2

											
										
										
											2023-04-15 14:43:12 +08:00
-												add moss-int4

											
										
										
											2023-07-13 22:21:00 +08:00
+								>>>>>>> f68d347c25b4bdd07f293c65a6e44a673a11f614
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
+								# LLM running device
 								LLM_DEVICE = "cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu"
-												add knowledge_base folder and move vector_store and content inside

											
										
										
											2023-06-13 23:54:29 +08:00
+								# 知识库默认存储路径
 								KB_ROOT_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "knowledge_base")
-												update project to v0.1.3

											
										
										
											2023-04-19 23:02:47 +08:00
-												update model_config.py

											
										
										
											2023-04-26 23:20:08 +08:00
+								# 基于上下文的prompt模版，请务必保留"{question}"和"{context}"
-												update PROMPT_TEMPLATE

											
										
										
											2023-05-02 00:28:09 +08:00
+								PROMPT_TEMPLATE = """已知信息：
-												Dev (#214)

* github: Add issue templates

* supports GPU usage in docker (#197)

* 上下文的prompt模版内容修改

---------

Co-authored-by: Calcitem <calcitem@outlook.com>
Co-authored-by: cocomany <124849750+cocomany@users.noreply.github.com>
Co-authored-by: glide-the <2533736852@qq.com>
											
										
										
											2023-05-01 23:55:37 +08:00
+								{context}
-												update PROMPT_TEMPLATE

											
										
										
											2023-05-02 00:28:09 +08:00
+								根据上述已知信息，简洁和专业的来回答用户的问题。如果无法从中得到答案，请说 “根据已知信息无法回答该问题” 或 “没有提供足够的相关信息”，不允许在答案中添加编造成分，答案请使用中文。 问题是：{question}"""
-												update text_splitter

											
										
										
											2023-04-28 00:02:42 +08:00
-												Update model_config.py (#768)

添加ChatGLM2-6b-int4和ChatGLM2-6b-int8
											
										
										
											2023-07-04 19:04:57 +08:00
+								# 缓存知识库数量,如果是ChatGLM2,ChatGLM2-int4,ChatGLM2-int8模型若检索效果不好可以调成’10’
-												use lru_cache to optimize loading of local vector store (#496)

* Add files via upload

* Update README.md

* use lru_cache to optimize loading of local vector store

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
Co-authored-by: liunux <liunux@office>
											
										
										
											2023-05-30 23:05:39 +08:00
+								CACHED_VS_NUM = 1
-												update chinese_text_splitter.py

											
										
										
											2023-05-06 23:26:49 +08:00
+								# 文本分句长度
 								SENTENCE_SIZE = 100
-												update text_splitter

											
										
										
											2023-04-28 00:02:42 +08:00
+								# 匹配后单段上下文长度
-												update torch_gc

											
										
										
											2023-05-04 20:48:36 +08:00
+								CHUNK_SIZE = 250
-												add knowledge_base folder and move vector_store and content inside

											
										
										
											2023-06-13 23:54:29 +08:00
+								# 传入LLM的历史记录长度
-												update torch_gc

											
										
										
											2023-05-04 20:48:36 +08:00
+								LLM_HISTORY_LEN = 3
-												add knowledge_base folder and move vector_store and content inside

											
										
										
											2023-06-13 23:54:29 +08:00
+								# 知识库检索时返回的匹配内容条数
-												update torch_gc

											
										
										
											2023-05-04 20:48:36 +08:00
+								VECTOR_SEARCH_TOP_K = 5
-												update README.md

											
										
										
											2023-05-11 00:09:38 +08:00
+								# 知识检索内容相关度 Score, 数值范围约为0-1100，如果为0，则不生效，经测试设置为小于500时，匹配结果更精准
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								VECTOR_SEARCH_SCORE_THRESHOLD = 390
-												新增加知识库测试能力 (#302)


											
										
										
											2023-05-10 17:18:20 +08:00
-												完善知识库路径问题，完善api接口 (#245)

* Fix 知识库无法上载,NLTK_DATA_PATH路径错误 (#236)

* Update chatglm_llm.py (#242)

* 完善知识库路径问题，完善api接口

统一webui、API接口知识库路径，后续路径如下：
知识库路经就是：/项目代码文件夹/vector_store/'知识库名字'
文件存放路经：/项目代码文件夹/content/'知识库名字'

修复通过api接口创建知识库的BUG，完善API接口功能。

* Update model_config.py

---------

Co-authored-by: Bob Chang <bob-chang@outlook.com>
Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-05-05 18:44:37 +08:00
+								NLTK_DATA_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "nltk_data")
-												logging: 格式日志输出 (#268)

* logging: 统一日志格式输出

---------

Co-authored-by: Bob Chang <bob.chang@amway.com>
Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-05-08 18:29:09 +08:00
 								FLAG_USER_NAME = uuid.uuid4().hex
 								logger.info(f"""
 								loading model config
 								llm device: {LLM_DEVICE}
 								embedding device: {EMBEDDING_DEVICE}
 								dir: {os.path.dirname(os.path.dirname(__file__))}
 								flagging username: {FLAG_USER_NAME}
-												新增加知识库测试能力 (#302)


											
										
										
											2023-05-10 17:18:20 +08:00
+								""")
-												增加允许跨域调用API功能 (#279)


											
										
										
											2023-05-11 09:32:58 +08:00
 								# 是否开启跨域，默认为False，如果需要开启，请设置为True
 								# is open cross domain
 								OPEN_CROSS_DOMAIN = False
-												update model_config.py

											
										
										
											2023-05-21 22:30:28 +08:00
 								# Bing 搜索必备变量
-												更新FAQ,model_config.py,bing_search.py文件，增加bing搜索问答相关问题的原因和可能解决方案，修复了一些typo;修改loader.py中load_in_8bit失败的原因和详细解决方案 (#610)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py
											
										
										
											2023-06-14 21:31:26 +08:00
+								# 使用 Bing 搜索需要使用 Bing Subscription Key,需要在azure port中申请试用bing search
 								# 具体申请方式请见
 								# https://learn.microsoft.com/en-us/bing/search-apis/bing-web-search/create-bing-search-service-resource
 								# 使用python创建bing api 搜索实例详见:
 								# https://learn.microsoft.com/en-us/bing/search-apis/bing-web-search/quickstarts/rest/python
-												update model_config.py

											
										
										
											2023-05-21 22:30:28 +08:00
+								BING_SEARCH_URL = "https://api.bing.microsoft.com/v7.0/search"
-												更新FAQ,model_config.py,bing_search.py文件，增加bing搜索问答相关问题的原因和可能解决方案，修复了一些typo;修改loader.py中load_in_8bit失败的原因和详细解决方案 (#610)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py
											
										
										
											2023-06-14 21:31:26 +08:00
+								# 注意不是bing Webmaster Tools的api key，
 								# 此外，如果是在服务器上，报Failed to establish a new connection: [Errno 110] Connection timed out
 								# 是因为服务器加了防火墙，需要联系管理员加白名单，如果公司的服务器的话，就别想了GG
-												标题增强 (#631)

* Add files via upload

* Update local_doc_qa.py

* Update model_config.py

* Update zh_title_enhance.py

* Add files via upload

* Update README.md

* fix bugs in MyFAISS.delete_doc

* fix:前端知识库获取失败.

* update zh_title_enhance.py

* update zh_title_enhance.py

* Update zh_title_enhance.py

* add test/textsplitter

* add test_zh_title_enhance.py

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
Co-authored-by: JZF <jiangzhifeng_jzf@163.com>
Co-authored-by: fxjhello <127916299+fxjhello@users.noreply.github.com>
											
										
										
											2023-06-18 21:45:06 +08:00
+								BING_SUBSCRIPTION_KEY = ""
 								# 是否开启中文标题加强，以及标题增强的相关配置
 								# 通过增加标题判断，判断哪些文本为标题，并在metadata中进行标记；
 								# 然后将文本与往上一级的标题进行拼合，实现文本信息的增强。
-												update requirements.txt and model_config.py

											
										
										
											2023-06-18 21:52:56 +08:00
+								ZH_TITLE_ENHANCE = False