Langchain-Chatchat/configs/model_config.py.example

import os
import logging
# 日志格式
LOG_FORMAT = "%(asctime)s - %(filename)s[line:%(lineno)d] - %(levelname)s: %(message)s"
logger = logging.getLogger()
logger.setLevel(logging.INFO)
logging.basicConfig(format=LOG_FORMAT)
# 是否显示详细日志
log_verbose = False


# 在以下字典中修改属性值，以指定本地embedding模型存储位置
# 如将 "text2vec": "GanymedeNil/text2vec-large-chinese" 修改为 "text2vec": "User/Downloads/text2vec-large-chinese"
# 此处请写绝对路径
embedding_model_dict = {
    "ernie-tiny": "nghuyong/ernie-3.0-nano-zh",
    "ernie-base": "nghuyong/ernie-3.0-base-zh",
    "text2vec-base": "shibing624/text2vec-base-chinese",
    "text2vec": "GanymedeNil/text2vec-large-chinese",
    "text2vec-paraphrase": "shibing624/text2vec-base-chinese-paraphrase",
    "text2vec-sentence": "shibing624/text2vec-base-chinese-sentence",
    "text2vec-multilingual": "shibing624/text2vec-base-multilingual",
    "text2vec-bge-large-chinese": "shibing624/text2vec-bge-large-chinese",
    "m3e-small": "moka-ai/m3e-small",
    "m3e-base": "moka-ai/m3e-base",
    "m3e-large": "moka-ai/m3e-large",
    "bge-small-zh": "BAAI/bge-small-zh",
    "bge-base-zh": "BAAI/bge-base-zh",
    "bge-large-zh": "BAAI/bge-large-zh",
    "bge-large-zh-noinstruct": "BAAI/bge-large-zh-noinstruct",
    "piccolo-base-zh": "sensenova/piccolo-base-zh",
    "piccolo-large-zh": "sensenova/piccolo-large-zh",
    "text-embedding-ada-002": os.environ.get("OPENAI_API_KEY")
}

# 选用的 Embedding 名称
EMBEDDING_MODEL = "m3e-base"

# Embedding 模型运行设备。设为"auto"会自动检测，也可手动设定为"cuda","mps","cpu"其中之一。
EMBEDDING_DEVICE = "auto"

llm_model_dict = {
    "chatglm-6b": {
        "local_model_path": "THUDM/chatglm-6b",
        "api_base_url": "http://localhost:8888/v1",  # "name"修改为fastchat服务中的"api_base_url"
        "api_key": "EMPTY"
    },

    "chatglm2-6b": {
        "local_model_path": "THUDM/chatglm2-6b",
        "api_base_url": "http://localhost:8888/v1",  # URL需要与运行fastchat服务端的server_config.FSCHAT_OPENAI_API一致
        "api_key": "EMPTY"
    },

    "chatglm2-6b-32k": {
        "local_model_path": "THUDM/chatglm2-6b-32k",  # "THUDM/chatglm2-6b-32k",
        "api_base_url": "http://localhost:8888/v1",  # "URL需要与运行fastchat服务端的server_config.FSCHAT_OPENAI_API一致
        "api_key": "EMPTY"
    },

    # 调用chatgpt时如果报出： urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='api.openai.com', port=443):
    #  Max retries exceeded with url: /v1/chat/completions
    # 则需要将urllib3版本修改为1.25.11
    # 如果依然报urllib3.exceptions.MaxRetryError: HTTPSConnectionPool，则将https改为http
    # 参考https://zhuanlan.zhihu.com/p/350015032

    # 如果报出：raise NewConnectionError(
    # urllib3.exceptions.NewConnectionError: <urllib3.connection.HTTPSConnection object at 0x000001FE4BDB85E0>:
    # Failed to establish a new connection: [WinError 10060]
    # 则是因为内地和香港的IP都被OPENAI封了，需要切换为日本、新加坡等地

    # 如果出现WARNING: Retrying langchain.chat_models.openai.acompletion_with_retry.<locals>._completion_with_retry in
    # 4.0 seconds as it raised APIConnectionError: Error communicating with OpenAI.
    # 需要添加代理访问(正常开的代理软件可能会拦截不上)需要设置配置openai_proxy 或者 使用环境遍历OPENAI_PROXY 进行设置
    # 比如: "openai_proxy": 'http://127.0.0.1:4780'
    "gpt-3.5-turbo": {
        "api_base_url": "https://api.openai.com/v1",
        "api_key": "",
        "openai_proxy": ""
    },
    # 线上模型。当前支持智谱AI。
    # 如果没有设置有效的local_model_path，则认为是在线模型API。
    # 请在server_config中为每个在线API设置不同的端口
    # 具体注册及api key获取请前往 http://open.bigmodel.cn
    "zhipu-api": {
        "api_base_url": "http://127.0.0.1:8888/v1",
        "api_key": "",
        "provider": "ChatGLMWorker",
        "version": "chatglm_pro",  # 可选包括 "chatglm_lite", "chatglm_std", "chatglm_pro"
    },
    "minimax-api": {
        "api_base_url": "http://127.0.0.1:8888/v1",
        "group_id": "",
        "api_key": "",
        "is_pro": False,
        "provider": "MiniMaxWorker",
    },
    "xinghuo-api": {
        "api_base_url": "http://127.0.0.1:8888/v1",
        "APPID": "",
        "APISecret": "",
        "api_key": "",
        "is_v2": False,
        "provider": "XingHuoWorker",
    },
    # 百度千帆 API，申请方式请参考 https://cloud.baidu.com/doc/WENXINWORKSHOP/s/4lilb2lpf
    "qianfan-api": {
        "version": "ernie-bot",  # 当前支持 "ernie-bot" 或 "ernie-bot-turbo"， 更多的见文档模型支持列表中千帆部分。
        "version_url": "", # 可以不填写version，直接填写在千帆申请模型发布的API地址
        "api_base_url": "http://127.0.0.1:8888/v1",
        "api_key": "",
        "secret_key": "",
        "provider": "ErnieWorker",
    }
}

# LLM 名称
LLM_MODEL = "chatglm2-6b"

# 历史对话轮数
HISTORY_LEN = 3

# LLM通用对话参数
TEMPERATURE = 0.7
# TOP_P = 0.95 # ChatOpenAI暂不支持该参数


# LLM 运行设备。设为"auto"会自动检测，也可手动设定为"cuda","mps","cpu"其中之一。
LLM_DEVICE = "auto"

# TextSplitter

text_splitter_dict = {
    "ChineseRecursiveTextSplitter": {
        "source": "",
        "tokenizer_name_or_path": "",
    },
    "SpacyTextSplitter": {
        "source": "huggingface",
        "tokenizer_name_or_path": "gpt2",
    },
    "RecursiveCharacterTextSplitter": {
        "source": "tiktoken",
        "tokenizer_name_or_path": "cl100k_base",
    },

    "MarkdownHeaderTextSplitter": {
        "headers_to_split_on":
            [
                ("#", "head1"),
                ("##", "head2"),
                ("###", "head3"),
                ("####", "head4"),
            ]
    },
}

# TEXT_SPLITTER 名称
TEXT_SPLITTER = "ChineseRecursiveTextSplitter"

# 知识库中单段文本长度(不适用MarkdownHeaderTextSplitter)
CHUNK_SIZE = 250

# 知识库中相邻文本重合长度(不适用MarkdownHeaderTextSplitter)
OVERLAP_SIZE = 0


# 日志存储路径
LOG_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "logs")
if not os.path.exists(LOG_PATH):
    os.mkdir(LOG_PATH)

# 知识库默认存储路径
KB_ROOT_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "knowledge_base")
if not os.path.exists(KB_ROOT_PATH):
    os.mkdir(KB_ROOT_PATH)
# 数据库默认存储路径。
# 如果使用sqlite，可以直接修改DB_ROOT_PATH；如果使用其它数据库，请直接修改SQLALCHEMY_DATABASE_URI。
DB_ROOT_PATH = os.path.join(KB_ROOT_PATH, "info.db")
SQLALCHEMY_DATABASE_URI = f"sqlite:///{DB_ROOT_PATH}"


# 可选向量库类型及对应配置
kbs_config = {
    "faiss": {
    },
    "milvus": {
        "host": "127.0.0.1",
        "port": "19530",
        "user": "",
        "password": "",
        "secure": False,
    },
    "pg": {
        "connection_uri": "postgresql://postgres:postgres@127.0.0.1:5432/langchain_chatchat",
    }
}

# 默认向量库类型。可选：faiss, milvus, pg.
DEFAULT_VS_TYPE = "faiss"

# 缓存向量库数量
CACHED_VS_NUM = 1

# 知识库匹配向量数量
VECTOR_SEARCH_TOP_K = 3

# 知识库匹配相关度阈值，取值范围在0-1之间，SCORE越小，相关度越高，取到1相当于不筛选，建议设置在0.5左右
SCORE_THRESHOLD = 1

# 搜索引擎匹配结题数量
SEARCH_ENGINE_TOP_K = 3

# nltk 模型存储路径
NLTK_DATA_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "nltk_data")

# 基于本地知识问答的提示词模版（使用Jinja2语法，简单点就是用双大括号代替f-string的单大括号
PROMPT_TEMPLATE = """<指令>根据已知信息，简洁和专业的来回答问题。如果无法从中得到答案，请说 “根据已知信息无法回答该问题”，不允许在答案中添加编造成分，答案请使用中文。 </指令>

<已知信息>{{ context }}</已知信息>

<问题>{{ question }}</问题>"""

# API 是否开启跨域，默认为False，如果需要开启，请设置为True
# is open cross domain
OPEN_CROSS_DOMAIN = False

# Bing 搜索必备变量
# 使用 Bing 搜索需要使用 Bing Subscription Key,需要在azure port中申请试用bing search
# 具体申请方式请见
# https://learn.microsoft.com/en-us/bing/search-apis/bing-web-search/create-bing-search-service-resource
# 使用python创建bing api 搜索实例详见:
# https://learn.microsoft.com/en-us/bing/search-apis/bing-web-search/quickstarts/rest/python
BING_SEARCH_URL = "https://api.bing.microsoft.com/v7.0/search"
# 注意不是bing Webmaster Tools的api key，

# 此外，如果是在服务器上，报Failed to establish a new connection: [Errno 110] Connection timed out
# 是因为服务器加了防火墙，需要联系管理员加白名单，如果公司的服务器的话，就别想了GG
BING_SUBSCRIPTION_KEY = ""

# 是否开启中文标题加强，以及标题增强的相关配置
# 通过增加标题判断，判断哪些文本为标题，并在metadata中进行标记；
# 然后将文本与往上一级的标题进行拼合，实现文本信息的增强。
ZH_TITLE_ENHANCE = False
-												update model_config.py

											
										
										
											2023-04-25 20:14:33 +08:00
+								import os
-												logging: 格式日志输出 (#268)

* logging: 统一日志格式输出

---------

Co-authored-by: Bob Chang <bob.chang@amway.com>
Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-05-08 18:29:09 +08:00
+								import logging
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								# 日志格式
-.*在config里将所有fastchat的命令行参数加入;2.*加入启动和停止fastchat的shell脚本；3. **增加了通过命令行启动所有fastchat服务的python脚本llm_api_sh.py;4. 修改了默认的config日志格式

											
										
										
											2023-08-01 17:59:20 +08:00
+								LOG_FORMAT = "%(asctime)s - %(filename)s[line:%(lineno)d] - %(levelname)s: %(message)s"
-												logging: 格式日志输出 (#268)

* logging: 统一日志格式输出

---------

Co-authored-by: Bob Chang <bob.chang@amway.com>
Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-05-08 18:29:09 +08:00
+								logger = logging.getLogger()
 								logger.setLevel(logging.INFO)
 								logging.basicConfig(format=LOG_FORMAT)
-												增加显示详细日志开关

											
										
										
											2023-09-08 20:48:31 +08:00
+								# 是否显示详细日志
 								log_verbose = False
-.*在config里将所有fastchat的命令行参数加入;2.*加入启动和停止fastchat的shell脚本；3. **增加了通过命令行启动所有fastchat服务的python脚本llm_api_sh.py;4. 修改了默认的config日志格式

											
										
										
											2023-08-01 17:59:20 +08:00
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
-												updata model_config.py

											
										
										
											2023-06-12 00:10:47 +08:00
+								# 在以下字典中修改属性值，以指定本地embedding模型存储位置
 								# 如将 "text2vec": "GanymedeNil/text2vec-large-chinese" 修改为 "text2vec": "User/Downloads/text2vec-large-chinese"
 								# 此处请写绝对路径
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
+								embedding_model_dict = {
 								    "ernie-tiny": "nghuyong/ernie-3.0-nano-zh",
 								    "ernie-base": "nghuyong/ernie-3.0-base-zh",
-												update model_config.py

											
										
										
											2023-04-27 07:40:57 +08:00
+								    "text2vec-base": "shibing624/text2vec-base-chinese",
-												update model_config.py

											
										
										
											2023-07-27 23:28:33 +08:00
+								    "text2vec": "GanymedeNil/text2vec-large-chinese",
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								    "text2vec-paraphrase": "shibing624/text2vec-base-chinese-paraphrase",
 								    "text2vec-sentence": "shibing624/text2vec-base-chinese-sentence",
 								    "text2vec-multilingual": "shibing624/text2vec-base-multilingual",
-												add support for shibing624/text2vec-bge-large-chinese

											
										
										
											2023-09-05 18:04:21 +08:00
+								    "text2vec-bge-large-chinese": "shibing624/text2vec-bge-large-chinese",
-												add support for new embedding models: moka-ai/m3e-base and moka-ai/m3e-small

											
										
										
											2023-06-09 19:04:34 +08:00
+								    "m3e-small": "moka-ai/m3e-small",
-												update model_config.py

											
										
										
											2023-07-27 23:28:33 +08:00
+								    "m3e-base": "moka-ai/m3e-base",
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								    "m3e-large": "moka-ai/m3e-large",
-												update model_config.py.example and README.md

											
										
										
											2023-08-09 23:45:27 +08:00
+								    "bge-small-zh": "BAAI/bge-small-zh",
 								    "bge-base-zh": "BAAI/bge-base-zh",
-												support for bge-large-zh-noinstruct and openai text-embedding-ada-002 (#1119)

* support for bge-large-zh-noinstruct and openai text-embedding-ada-002

* 完善了readme,修改了BGE模型的载入方式

* 补充了readme中bge-large-zh-noinstruct的信息

* Update faiss_kb_service.py

* Update utils.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-08-23 22:55:53 +08:00
+								    "bge-large-zh": "BAAI/bge-large-zh",
 								    "bge-large-zh-noinstruct": "BAAI/bge-large-zh-noinstruct",
-												add support for new embedding models sensenova/piccolo-base-zh and sensenova/piccolo-large-zh

											
										
										
											2023-09-06 21:17:32 +08:00
+								    "piccolo-base-zh": "sensenova/piccolo-base-zh",
 								    "piccolo-large-zh": "sensenova/piccolo-large-zh",
-												support for bge-large-zh-noinstruct and openai text-embedding-ada-002 (#1119)

* support for bge-large-zh-noinstruct and openai text-embedding-ada-002

* 完善了readme,修改了BGE模型的载入方式

* 补充了readme中bge-large-zh-noinstruct的信息

* Update faiss_kb_service.py

* Update utils.py

---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-08-23 22:55:53 +08:00
+								    "text-embedding-ada-002": os.environ.get("OPENAI_API_KEY")
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
+								}
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								# 选用的 Embedding 名称
-												add chatglm2-6b-32k and make m3e default embedding model

											
										
										
											2023-08-01 14:12:28 +08:00
+								EMBEDDING_MODEL = "m3e-base"
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
-												优化LLM和Embedding模型运行设备配置，可设为auto自动检测；修复：重建知识库时FAISS未保存 (#1330)

* 避免configs对torch的依赖；
* webui自动从configs获取api地址(close #1319)
* bug fix: 重建知识库时FAISS未保存
* 优化LLM和Embedding模型运行设备配置，可设为auto自动检测
											
										
										
											2023-08-31 17:44:48 +08:00
+								# Embedding 模型运行设备。设为"auto"会自动检测，也可手动设定为"cuda","mps","cpu"其中之一。
 								EMBEDDING_DEVICE = "auto"
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
 								llm_model_dict = {
-												llm_model_dict 处理了loader的一些预设行为，如加载位置，模型名称，模型处理器实例, 定义checkpoint名称和远程路径
loader.py: 模型重载
定义 generatorAnswer 增加 AnswerResultStream
   定义generate_with_callback收集器，在每次响应时将队列数据同步到AnswerResult
requirements.txt 变更项目依赖

											
										
										
											2023-05-18 22:54:41 +08:00
+								    "chatglm-6b": {
-												会议记录

											
										
										
											2023-07-28 16:12:57 +08:00
+								        "local_model_path": "THUDM/chatglm-6b",
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								        "api_base_url": "http://localhost:8888/v1",  # "name"修改为fastchat服务中的"api_base_url"
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
+								        "api_key": "EMPTY"
-												debug for fastchat_openai_llm

											
										
										
											2023-07-19 10:00:23 +08:00
+								    },
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
 								    "chatglm2-6b": {
-												会议记录

											
										
										
											2023-07-28 16:12:57 +08:00
+								        "local_model_path": "THUDM/chatglm2-6b",
-												add startup.py: start specified servers with one command. see python startup.py --help

											
										
										
											2023-08-17 13:24:53 +08:00
+								        "api_base_url": "http://localhost:8888/v1",  # URL需要与运行fastchat服务端的server_config.FSCHAT_OPENAI_API一致
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								        "api_key": "EMPTY"
-												Add chatglm2-6b configs

											
										
										
											2023-06-25 17:04:16 +08:00
+								    },
-												适配远程LLM调用

											
										
										
											2023-05-31 22:11:28 +08:00
-												add chatglm2-6b-32k and make m3e default embedding model

											
										
										
											2023-08-01 14:12:28 +08:00
+								    "chatglm2-6b-32k": {
 								        "local_model_path": "THUDM/chatglm2-6b-32k",  # "THUDM/chatglm2-6b-32k",
-												add startup.py: start specified servers with one command. see python startup.py --help

											
										
										
											2023-08-17 13:24:53 +08:00
+								        "api_base_url": "http://localhost:8888/v1",  # "URL需要与运行fastchat服务端的server_config.FSCHAT_OPENAI_API一致
-												add chatglm2-6b-32k and make m3e default embedding model

											
										
										
											2023-08-01 14:12:28 +08:00
+								        "api_key": "EMPTY"
 								    },
-												测试OPENAI接口成功 (#813)


											
										
										
											2023-07-11 23:40:49 +08:00
+								    # 调用chatgpt时如果报出： urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='api.openai.com', port=443):
 								    #  Max retries exceeded with url: /v1/chat/completions
 								    # 则需要将urllib3版本修改为1.25.11
-												补充openai的连接失败问题解决方案

											
										
										
											2023-07-21 09:29:43 +08:00
+								    # 如果依然报urllib3.exceptions.MaxRetryError: HTTPSConnectionPool，则将https改为http
 								    # 参考https://zhuanlan.zhihu.com/p/350015032
-												测试OPENAI接口成功 (#813)


											
										
										
											2023-07-11 23:40:49 +08:00
 								    # 如果报出：raise NewConnectionError(
-												修改模型生成的调用方式，兼容Chain调用
修改模型切换的bug

											
										
										
											2023-07-12 23:09:28 +08:00
+								    # urllib3.exceptions.NewConnectionError: <urllib3.connection.HTTPSConnection object at 0x000001FE4BDB85E0>:
-												测试OPENAI接口成功 (#813)


											
										
										
											2023-07-11 23:40:49 +08:00
+								    # Failed to establish a new connection: [WinError 10060]
-												temporarily save

											
										
										
											2023-07-19 10:57:09 +08:00
+								    # 则是因为内地和香港的IP都被OPENAI封了，需要切换为日本、新加坡等地
-												添加chatgpt 调用代理设置

											
										
										
											2023-08-24 13:51:17 +08:00
 								    # 如果出现WARNING: Retrying langchain.chat_models.openai.acompletion_with_retry.<locals>._completion_with_retry in
 								    # 4.0 seconds as it raised APIConnectionError: Error communicating with OpenAI.
 								    # 需要添加代理访问(正常开的代理软件可能会拦截不上)需要设置配置openai_proxy 或者 使用环境遍历OPENAI_PROXY 进行设置
-												添加例子例子"openai_proxy": 'http://127.0.0.1:4780'

											
										
										
											2023-09-01 18:09:59 +08:00
+								    # 比如: "openai_proxy": 'http://127.0.0.1:4780'
-												update model_config.py.example

											
										
										
											2023-08-14 18:53:22 +08:00
+								    "gpt-3.5-turbo": {
 								        "api_base_url": "https://api.openai.com/v1",
-												update model_config.py.example

											
										
										
											2023-09-14 22:27:57 +08:00
+								        "api_key": "",
 								        "openai_proxy": ""
-.增加对llama-cpp模型的支持；2.增加对bloom/chatyuan/baichuan模型的支持；3. 修复多GPU部署的bug;4. 修复了moss_llm.py的bug；5. 增加对openai支持（没有api,未测试);6. 支持在多卡情况自定义设备GPU (#664)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py

* stream_chat_bing

* 修改stream_chat的接口，在请求体中选择knowledge_base_id;增加stream_chat_bing接口

* 优化cli_demo.py的逻辑：支持 输入提示；多输入；重新输入

* update cli_demo.py

* add bloom-3b,bloom-7b1,ggml-vicuna-13b-1.1

* 1.增加对llama-cpp模型的支持；2.增加对bloom模型的支持；3. 修复多GPU部署的bug;4. 增加对openai支持（没有api,未测试)；5.增加了llama-cpp模型部署的说明

* llama模型兼容性说明

* modified:   ../configs/model_config.py
	modified:   ../docs/INSTALL.md
在install.md里增加对llama-cpp模型调用的说明

* 修改llama_llm.py以适应llama-cpp模型

* 完成llama-cpp模型的支持；

* make fastchat and openapi compatiable

* 1. 修复/增加对chatyuan,bloom,baichuan-7等模型的支持；2. 修复了moss_llm.py的bug;

* set default model be chatglm-6b

* 在多卡情况下也支持自定义GPU设备

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-07-11 19:36:50 +08:00
+								    },
-												添加切换模型功能，支持智谱AI在线模型 (#1342)

* 添加LLM模型切换功能，需要在server_config中设置可切换的模型
* add tests for api.py/llm_model/*
* - 支持模型切换
- 支持智普AI线上模型
- startup.py增加参数`--api-worker`，自动运行所有的线上API模型。使用`-a
  (--all-webui), --all-api`时默认开启该选项
* 修复被fastchat覆盖的标准输出
* 对fastchat日志进行更细致的控制，startup.py中增加-q(--quiet)开关，可以减少无用的fastchat日志输出
* 修正chatglm api的对话模板


Co-authored-by: liunux4odoo <liunu@qq.com>
											
										
										
											2023-09-01 23:58:09 +08:00
+								    # 线上模型。当前支持智谱AI。
 								    # 如果没有设置有效的local_model_path，则认为是在线模型API。
 								    # 请在server_config中为每个在线API设置不同的端口
-												update model_config.py.example

											
										
										
											2023-09-03 15:52:17 +08:00
+								    # 具体注册及api key获取请前往 http://open.bigmodel.cn
-												修改智谱API默认名称，给WEBUI设置主题 (#1484)

* 給WEBUI设置主题

* chatglm-api更名为zhipu-api
											
										
										
											2023-09-15 01:48:02 +08:00
+								    "zhipu-api": {
-												添加切换模型功能，支持智谱AI在线模型 (#1342)

* 添加LLM模型切换功能，需要在server_config中设置可切换的模型
* add tests for api.py/llm_model/*
* - 支持模型切换
- 支持智普AI线上模型
- startup.py增加参数`--api-worker`，自动运行所有的线上API模型。使用`-a
  (--all-webui), --all-api`时默认开启该选项
* 修复被fastchat覆盖的标准输出
* 对fastchat日志进行更细致的控制，startup.py中增加-q(--quiet)开关，可以减少无用的fastchat日志输出
* 修正chatglm api的对话模板


Co-authored-by: liunux4odoo <liunu@qq.com>
											
										
										
											2023-09-01 23:58:09 +08:00
+								        "api_base_url": "http://127.0.0.1:8888/v1",
-												update model_config.py.example

											
										
										
											2023-09-14 22:27:57 +08:00
+								        "api_key": "",
-												添加切换模型功能，支持智谱AI在线模型 (#1342)

* 添加LLM模型切换功能，需要在server_config中设置可切换的模型
* add tests for api.py/llm_model/*
* - 支持模型切换
- 支持智普AI线上模型
- startup.py增加参数`--api-worker`，自动运行所有的线上API模型。使用`-a
  (--all-webui), --all-api`时默认开启该选项
* 修复被fastchat覆盖的标准输出
* 对fastchat日志进行更细致的控制，startup.py中增加-q(--quiet)开关，可以减少无用的fastchat日志输出
* 修正chatglm api的对话模板


Co-authored-by: liunux4odoo <liunu@qq.com>
											
										
										
											2023-09-01 23:58:09 +08:00
+								        "provider": "ChatGLMWorker",
-												update model_config.py.example

											
										
										
											2023-09-02 15:33:57 +08:00
+								        "version": "chatglm_pro",  # 可选包括 "chatglm_lite", "chatglm_std", "chatglm_pro"
-												添加切换模型功能，支持智谱AI在线模型 (#1342)

* 添加LLM模型切换功能，需要在server_config中设置可切换的模型
* add tests for api.py/llm_model/*
* - 支持模型切换
- 支持智普AI线上模型
- startup.py增加参数`--api-worker`，自动运行所有的线上API模型。使用`-a
  (--all-webui), --all-api`时默认开启该选项
* 修复被fastchat覆盖的标准输出
* 对fastchat日志进行更细致的控制，startup.py中增加-q(--quiet)开关，可以减少无用的fastchat日志输出
* 修正chatglm api的对话模板


Co-authored-by: liunux4odoo <liunu@qq.com>
											
										
										
											2023-09-01 23:58:09 +08:00
+								    },
-												增加了自定义分词器适配 (#1462)

* 添加了自定义分词器适配和测试文件
---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-13 15:42:12 +08:00
+								    "minimax-api": {
-												添加MiniMax在线API支持 (#1445)


											
										
										
											2023-09-12 15:24:47 +08:00
+								        "api_base_url": "http://127.0.0.1:8888/v1",
 								        "group_id": "",
 								        "api_key": "",
 								        "is_pro": False,
 								        "provider": "MiniMaxWorker",
 								    },
-												增加了自定义分词器适配 (#1462)

* 添加了自定义分词器适配和测试文件
---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-13 15:42:12 +08:00
+								    "xinghuo-api": {
-												支持讯飞星火大模型在线API (#1460)

* 支持讯飞星火大模型在线API
											
										
										
											2023-09-13 13:51:05 +08:00
+								        "api_base_url": "http://127.0.0.1:8888/v1",
 								        "APPID": "",
 								        "APISecret": "",
 								        "api_key": "",
 								        "is_v2": False,
 								        "provider": "XingHuoWorker",
-												增加 百度文心一言 API 接入支持 (#1477)

* add RapidOCRPDFLoader

* update mypdfloader.py and requirements.txt

* add myimgloader.py

* add test samples

* add TODO to mypdfloader

* add loaders to KnowledgeFile class

* add loaders to KnowledgeFile class

* add ChineseRecursiveTextSplitter

* add ChineseRecursiveTextSplitter

* add baidu ernie api
											
										
										
											2023-09-14 15:30:06 +08:00
+								    },
-												修复文心一言，添加测试用例

											
										
										
											2023-09-14 23:37:34 +08:00
+								    # 百度千帆 API，申请方式请参考 https://cloud.baidu.com/doc/WENXINWORKSHOP/s/4lilb2lpf
 								    "qianfan-api": {
-												补充更多千帆平台支持的模型；除了指定模型名称，支持直接指定模型APIURL，便于填写单独申请的模型地址

											
										
										
											2023-09-15 00:30:18 +08:00
+								        "version": "ernie-bot",  # 当前支持 "ernie-bot" 或 "ernie-bot-turbo"， 更多的见文档模型支持列表中千帆部分。
 								        "version_url": "", # 可以不填写version，直接填写在千帆申请模型发布的API地址
-												增加 百度文心一言 API 接入支持 (#1477)

* add RapidOCRPDFLoader

* update mypdfloader.py and requirements.txt

* add myimgloader.py

* add test samples

* add TODO to mypdfloader

* add loaders to KnowledgeFile class

* add loaders to KnowledgeFile class

* add ChineseRecursiveTextSplitter

* add ChineseRecursiveTextSplitter

* add baidu ernie api
											
										
										
											2023-09-14 15:30:06 +08:00
+								        "api_base_url": "http://127.0.0.1:8888/v1",
 								        "api_key": "",
 								        "secret_key": "",
 								        "provider": "ErnieWorker",
-												支持讯飞星火大模型在线API (#1460)

* 支持讯飞星火大模型在线API
											
										
										
											2023-09-13 13:51:05 +08:00
+								    }
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
+								}
-												使用model_config默认配置启动
llama_llm.py 删除流式输出
base.py、shared.py 删除多余代码
fastchat_llm.py 业务实现

											
										
										
											2023-05-23 23:10:31 +08:00
+								# LLM 名称
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								LLM_MODEL = "chatglm2-6b"
-												add streaming option in configs/model_config.py

											
										
										
											2023-05-01 17:50:16 +08:00
-												优化server_config配置项 (#1293)

* update server_config.py:
- 在model_config中增加HISTORY_LEN配置参数
- 将server_config中helper function移动到server.utils中
- 统一set_httpx_timeout的定义和调用

* update webui.py:
应用model_config中的配置项：HISTORY_LEN,VECTOR_SEARCH_TOP_K,SEARCH_ENGINE_TOP_K

---------

Co-authored-by: liunux4odoo <liunu@qq.com>
											
										
										
											2023-08-29 10:06:09 +08:00
+								# 历史对话轮数
 								HISTORY_LEN = 3
-												api和webui知识库操作支持chunk_size/overlap_size/zh_title_enhance参数 (#1459)


											
										
										
											2023-09-13 11:19:47 +08:00
+								# LLM通用对话参数
 								TEMPERATURE = 0.7
 								# TOP_P = 0.95 # ChatOpenAI暂不支持该参数
-												增加了自定义分词器适配 (#1462)

* 添加了自定义分词器适配和测试文件
---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-13 15:42:12 +08:00
-												update model_config.py.example

											
										
										
											2023-09-02 15:33:57 +08:00
+								# LLM 运行设备。设为"auto"会自动检测，也可手动设定为"cuda","mps","cpu"其中之一。
-												优化LLM和Embedding模型运行设备配置，可设为auto自动检测；修复：重建知识库时FAISS未保存 (#1330)

* 避免configs对torch的依赖；
* webui自动从configs获取api地址(close #1319)
* bug fix: 重建知识库时FAISS未保存
* 优化LLM和Embedding模型运行设备配置，可设为auto自动检测
											
										
										
											2023-08-31 17:44:48 +08:00
+								LLM_DEVICE = "auto"
-												修改项目架构

											
										
										
											2023-04-13 23:01:52 +08:00
-												增加了自定义分词器适配 (#1462)

* 添加了自定义分词器适配和测试文件
---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-13 15:42:12 +08:00
+								# TextSplitter
 								text_splitter_dict = {
 								    "ChineseRecursiveTextSplitter": {
-												修复测试文件 (#1467)

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-13 17:12:05 +08:00
+								        "source": "",
-												增加了自定义分词器适配 (#1462)

* 添加了自定义分词器适配和测试文件
---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-13 15:42:12 +08:00
+								        "tokenizer_name_or_path": "",
 								    },
-												update model_config.py.example

											
										
										
											2023-09-14 22:29:26 +08:00
+								    "SpacyTextSplitter": {
 								        "source": "huggingface",
 								        "tokenizer_name_or_path": "gpt2",
 								    },
-												增加了自定义分词器适配 (#1462)

* 添加了自定义分词器适配和测试文件
---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-13 15:42:12 +08:00
+								    "RecursiveCharacterTextSplitter": {
 								        "source": "tiktoken",
 								        "tokenizer_name_or_path": "cl100k_base",
 								    },
 								    "MarkdownHeaderTextSplitter": {
 								        "headers_to_split_on":
 								            [
 								                ("#", "head1"),
 								                ("##", "head2"),
 								                ("###", "head3"),
 								                ("####", "head4"),
 								            ]
 								    },
 								}
 								# TEXT_SPLITTER 名称
-												update README.md

											
										
										
											2023-09-15 09:53:58 +08:00
+								TEXT_SPLITTER = "ChineseRecursiveTextSplitter"
-												增加了自定义分词器适配 (#1462)

* 添加了自定义分词器适配和测试文件
---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-13 15:42:12 +08:00
 								# 知识库中单段文本长度(不适用MarkdownHeaderTextSplitter)
 								CHUNK_SIZE = 250
 								# 知识库中相邻文本重合长度(不适用MarkdownHeaderTextSplitter)
-												update model_config.py.example

											
										
										
											2023-09-14 22:29:49 +08:00
+								OVERLAP_SIZE = 0
-												增加了自定义分词器适配 (#1462)

* 添加了自定义分词器适配和测试文件
---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-13 15:42:12 +08:00
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								# 日志存储路径
 								LOG_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "logs")
-												会议记录

											
										
										
											2023-07-28 16:12:57 +08:00
+								if not os.path.exists(LOG_PATH):
 								    os.mkdir(LOG_PATH)
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
-												add knowledge_base folder and move vector_store and content inside

											
										
										
											2023-06-13 23:54:29 +08:00
+								# 知识库默认存储路径
 								KB_ROOT_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "knowledge_base")
-												知识库默认存储路径 默认自动创建

											
										
										
											2023-09-05 17:27:43 +08:00
+								if not os.path.exists(KB_ROOT_PATH):
 								    os.mkdir(KB_ROOT_PATH)
-												move configs to configs.model_config

											
										
										
											2023-08-08 15:56:32 +08:00
+								# 数据库默认存储路径。
 								# 如果使用sqlite，可以直接修改DB_ROOT_PATH；如果使用其它数据库，请直接修改SQLALCHEMY_DATABASE_URI。
-. add add_doc and list_docs to KnowledgeBase class
2. add DB_ROOT_PATH to model_config.py.example

											
										
										
											2023-08-05 22:57:19 +08:00
+								DB_ROOT_PATH = os.path.join(KB_ROOT_PATH, "info.db")
-												move KBServiceFactory to server.knowledge_base.kb_service.base

											
										
										
											2023-08-08 17:41:58 +08:00
+								SQLALCHEMY_DATABASE_URI = f"sqlite:///{DB_ROOT_PATH}"
-. add add_doc and list_docs to KnowledgeBase class
2. add DB_ROOT_PATH to model_config.py.example

											
										
										
											2023-08-05 22:57:19 +08:00
-												增加了自定义分词器适配 (#1462)

* 添加了自定义分词器适配和测试文件
---------

Co-authored-by: zR <zRzRzRzRzRzRzR>
											
										
										
											2023-09-13 15:42:12 +08:00
-												update webui layout

											
										
										
											2023-08-11 23:36:31 +08:00
+								# 可选向量库类型及对应配置
 								kbs_config = {
 								    "faiss": {
 								    },
 								    "milvus": {
 								        "host": "127.0.0.1",
 								        "port": "19530",
 								        "user": "",
 								        "password": "",
 								        "secure": False,
 								    },
 								    "pg": {
-												添加milvus 和 pg QA说明

											
										
										
											2023-08-20 18:03:23 +08:00
+								        "connection_uri": "postgresql://postgres:postgres@127.0.0.1:5432/langchain_chatchat",
-												update webui layout

											
										
										
											2023-08-11 23:36:31 +08:00
+								    }
 								}
-												add tools to migrate knowledge base

											
										
										
											2023-08-11 08:33:05 +08:00
+								# 默认向量库类型。可选：faiss, milvus, pg.
 								DEFAULT_VS_TYPE = "faiss"
-												add new config variable to config example

											
										
										
											2023-08-04 09:16:28 +08:00
+								# 缓存向量库数量
 								CACHED_VS_NUM = 1
 								# 知识库匹配向量数量
-												update knowledge_base and dialogue page of webui

											
										
										
											2023-09-15 13:45:47 +08:00
+								VECTOR_SEARCH_TOP_K = 3
-												add new config variable to config example

											
										
										
											2023-08-04 09:16:28 +08:00
-												add SCORE_THRESHOLD to faiss and milvus kb service

											
										
										
											2023-08-10 00:36:51 +08:00
+								# 知识库匹配相关度阈值，取值范围在0-1之间，SCORE越小，相关度越高，取到1相当于不筛选，建议设置在0.5左右
 								SCORE_THRESHOLD = 1
-												add new config variable to config example

											
										
										
											2023-08-04 09:16:28 +08:00
+								# 搜索引擎匹配结题数量
-												update knowledge_base and dialogue page of webui

											
										
										
											2023-09-15 13:45:47 +08:00
+								SEARCH_ENGINE_TOP_K = 3
-												add new config variable to config example

											
										
										
											2023-08-04 09:16:28 +08:00
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								# nltk 模型存储路径
-												完善知识库路径问题，完善api接口 (#245)

* Fix 知识库无法上载,NLTK_DATA_PATH路径错误 (#236)

* Update chatglm_llm.py (#242)

* 完善知识库路径问题，完善api接口

统一webui、API接口知识库路径，后续路径如下：
知识库路经就是：/项目代码文件夹/vector_store/'知识库名字'
文件存放路经：/项目代码文件夹/content/'知识库名字'

修复通过api接口创建知识库的BUG，完善API接口功能。

* Update model_config.py

---------

Co-authored-by: Bob Chang <bob-chang@outlook.com>
Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-05-05 18:44:37 +08:00
+								NLTK_DATA_PATH = os.path.join(os.path.dirname(os.path.dirname(__file__)), "nltk_data")
-												logging: 格式日志输出 (#268)

* logging: 统一日志格式输出

---------

Co-authored-by: Bob Chang <bob.chang@amway.com>
Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
											
										
										
											2023-05-08 18:29:09 +08:00
-												fix #1142: 在History中使用jinja2模板代替f-string，避免消息中含有{ }时出错

											
										
										
											2023-08-23 08:35:26 +08:00
+								# 基于本地知识问答的提示词模版（使用Jinja2语法，简单点就是用双大括号代替f-string的单大括号
-												update prompt template

											
										
										
											2023-08-23 21:52:12 +08:00
+								PROMPT_TEMPLATE = """<指令>根据已知信息，简洁和专业的来回答问题。如果无法从中得到答案，请说 “根据已知信息无法回答该问题”，不允许在答案中添加编造成分，答案请使用中文。 </指令>
-												增加允许跨域调用API功能 (#279)


											
										
										
											2023-05-11 09:32:58 +08:00
-												update prompt template

											
										
										
											2023-08-23 21:52:12 +08:00
+								<已知信息>{{ context }}</已知信息>
-												更新FAQ,model_config.py,bing_search.py文件，增加bing搜索问答相关问题的原因和可能解决方案，修复了一些typo;修改loader.py中load_in_8bit失败的原因和详细解决方案 (#610)

* 修复 bing_search.py的typo;更新model_config.py中Bing Subscription Key申请方式及注意事项

* 更新FAQ，增加了[Errno 110] Connection timed out的原因与解决方案

* 修改loader.py中load_in_8bit失败的原因和详细解决方案

* update loader.py
											
										
										
											2023-06-14 21:31:26 +08:00
-												update prompt template

											
										
										
											2023-08-23 21:52:12 +08:00
+								<问题>{{ question }}</问题>"""
-												标题增强 (#631)

* Add files via upload

* Update local_doc_qa.py

* Update model_config.py

* Update zh_title_enhance.py

* Add files via upload

* Update README.md

* fix bugs in MyFAISS.delete_doc

* fix:前端知识库获取失败.

* update zh_title_enhance.py

* update zh_title_enhance.py

* Update zh_title_enhance.py

* add test/textsplitter

* add test_zh_title_enhance.py

---------

Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>
Co-authored-by: JZF <jiangzhifeng_jzf@163.com>
Co-authored-by: fxjhello <127916299+fxjhello@users.noreply.github.com>
											
										
										
											2023-06-18 21:45:06 +08:00
-												v0.2.0 first commit

											
										
										
											2023-07-27 23:22:07 +08:00
+								# API 是否开启跨域，默认为False，如果需要开启，请设置为True
 								# is open cross domain
-												add bing_search_chat.py and duckduckgo_search_chat.py

											
										
										
											2023-08-01 16:39:17 +08:00
+								OPEN_CROSS_DOMAIN = False
 								# Bing 搜索必备变量
 								# 使用 Bing 搜索需要使用 Bing Subscription Key,需要在azure port中申请试用bing search
 								# 具体申请方式请见
 								# https://learn.microsoft.com/en-us/bing/search-apis/bing-web-search/create-bing-search-service-resource
 								# 使用python创建bing api 搜索实例详见:
 								# https://learn.microsoft.com/en-us/bing/search-apis/bing-web-search/quickstarts/rest/python
 								BING_SEARCH_URL = "https://api.bing.microsoft.com/v7.0/search"
 								# 注意不是bing Webmaster Tools的api key，
 								# 此外，如果是在服务器上，报Failed to establish a new connection: [Errno 110] Connection timed out
 								# 是因为服务器加了防火墙，需要联系管理员加白名单，如果公司的服务器的话，就别想了GG
-												Merge branch 'dev_fastchat' of github.com:chatchat-space/langchain-ChatGLM into dev_fastchat

											
										
										
											2023-08-01 18:02:52 +08:00
+								BING_SUBSCRIPTION_KEY = ""
-												add KBService and KBServiceFactory class

											
										
										
											2023-08-06 23:43:54 +08:00
-												re-add zh_title_enhance.py

											
										
										
											2023-08-09 23:09:24 +08:00
+								# 是否开启中文标题加强，以及标题增强的相关配置
 								# 通过增加标题判断，判断哪些文本为标题，并在metadata中进行标记；
 								# 然后将文本与往上一级的标题进行拼合，实现文本信息的增强。
-												避免configs对torch的依赖；webui自动从configs获取api地址(close #1319) (#1328)


											
										
										
											2023-08-31 16:18:12 +08:00
+								ZH_TITLE_ENHANCE = False