Langchain-Chatchat

Commit Graph

Author	SHA1	Message	Date
wvivi2023	afa07ad208	enhance	2024-01-16 15:37:47 +08:00
wvivi2023	c5d1ff6621	enhance	2024-01-15 09:54:00 +08:00
wvivi2023	0c0c87a3fb	use streamingresponse to return	2024-01-11 09:06:27 +08:00
wvivi2023	3593e6ca2c	update	2024-01-04 18:02:43 +08:00
liunux4odoo	c179230ce0	remove /chat/fastchat API endpoint (#2506 )	2023-12-29 09:44:37 +08:00
liunux4odoo	5cccd5e7aa	merge from master	2023-12-29 09:10:01 +08:00
liunux4odoo	9ff7bef2c2	新功能：知识库管理界面支持查看、编辑、删除向量库文档 (#2471 ) * 新功能： - 知识库管理界面支持查看、编辑、删除向量库文档。暂不支持增加（aggrid添加新行比较麻烦，需要另外实现） - 去除知识库管理界面中重建知识库和删除知识库按钮，建议用户到终端命令操作修复： - 所有与知识库名称、文件名称有关的数据库操作函数都改成大小写不敏感，所有路径统一为 posix 风格，避免因路径文本不一致导致数据重复和操作失效（close #2232）开发者： - 添加 update_docs_by_id 函数与 API 接口。当前仅支持 FAISS，暂时未用到，未将来对知识库做更细致的修改做准备 - 统一 DocumentWithScore 与 DocumentWithVsId - FAISS 返回的 Document.metadata 中包含 ID，方便后续查找比对 - /knowledge_base/search_docs 接口支持 file_name, metadata 参数，可以据此检索文档 * fix bug	2023-12-26 13:44:36 +08:00
hzg0601	129c765a74	新增特性:reranker对向量召回文本进行重排	2023-12-21 19:05:11 +08:00
hzg0601	5891f94c88	temporarily add reranker	2023-12-21 16:05:16 +08:00
Astlvk	7e01e82470	fixed 迭代器参数传递错误，知识库问答报错TypeError: unhashable type: 'list' (#2383 ) Co-authored-by: liunux4odoo <41217877+liunux4odoo@users.noreply.github.com>	2023-12-15 07:54:36 +08:00
xldistance	7e8391eb55	修复knowledge_base_chat_iterator传参错误 (#2386 )	2023-12-15 07:53:36 +08:00
liunux4odoo	472a97a616	所有 chat 接口都改为 EventSourceResponse；ApiRequest 作对应修改	2023-12-13 16:53:24 +08:00
liunux4odoo	c8fef3380c	merge from dev	2023-12-13 16:52:40 +08:00
liunux4odoo	2604c9e761	fix: prompt template name error in file_chat (#2366 )	2023-12-12 21:12:33 +08:00
liunux4odoo	7d2de47bcf	文件对话和知识库对话 API 接口实现全异步操作，防止阻塞 (#2256 ) * EmbeddingFunAdapter 支持异步操作；文件对话和知识库对话 API 接口实现全异步操作，防止阻塞 * 修复：使 list_files_from_folder 返回相对路径	2023-12-02 19:22:44 +08:00
liunux4odoo	4fa28c71b1	修复：chat 接口默认使用 memory获取10条历史消息，导致最终拼接的prompt出错 (#2247 ) 修改后默认使用用户传入的history，只有同时传入conversation_id和history_len时才从数据库读取历史消息使用memory还有一个问题，对话角色是固定的，不能适配不同的模型。其它：注释一些无用的 print	2023-12-01 11:35:43 +08:00
imClumsyPanda	c34b4136c0	update file format	2023-11-30 23:33:48 +08:00
zR	b7a50daa0f	更新Langchain依赖到0.0.342以上版本 (#2212 )	2023-11-29 15:08:13 +08:00
liunux4odoo	7d580d9a47	修复：*_chat 接口中重设 max_tokens 时导致 `local variable 'max_tokens' referenced before assignment` 错误	2023-11-28 21:00:00 +08:00
liunux4odoo	8b695dba03	*_chat 接口中，当 max_tokens=0时，将其设为 None,避免 swagger ui 中默认值为0时访问出错	2023-11-26 16:47:58 +08:00
liunux4odoo	1de4258aa0	给 ApiModelWorker 添加 logger 成员变量，API请求出错时输出有意义的错误信息。 (#2169 ) * 给 ApiModelWorker 添加 logger 成员变量，API请求出错时输出有意义的错误信息。 /chat/chat 接口 conversation_id参数改为默认 ""，避免 swagger 页面默认值错误导致历史消息失效 * 修复在线模型一些bug	2023-11-25 13:51:07 +08:00
liunux4odoo	aae4144476	数据库和向量库中文档 metadata["source"] 改为相对路径，便于向量库迁移 (#2153 ) 修复： - 上传知识库文件名称包括子目录时，自动创建子目录	2023-11-23 19:54:00 +08:00
qiankunli	1c97673d41	feat: add db memory (#2046 ) * feat: add db memory * WEBUI 添加多会话功能 --------- Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> Co-authored-by: liunux4odoo <liunux@qq.com>	2023-11-22 18:38:26 +08:00
liunux4odoo	3b3d948d27	添加文件对话模式 (#2071 ) 开发者： - 添加 /chat/file_chat, /knowledge_base/upload_temp_docs API 接口 - 添加 CACHED_MEMO_VS_NUM, BASE_TEMP_DIR 配置项	2023-11-16 07:39:27 +08:00
zR	21b079d751	GLM3支持传入提示词 (#2058 ) 支持传入提示词的Agent ChatGLM3-6B	2023-11-14 17:45:22 +08:00
zR	91ff0574df	支持ChatGLM3-6B (#2021 ) * 更新依赖和配置文件中的Agent模型 * 支持基础的glm3_agent	2023-11-12 16:45:50 +08:00
liunux4odoo	b51ba11f45	支持通过配置项同时启动多个模型，将Wiki纳入samples知识库 (#2002 ) 新功能： - 将 LLM_MODEL 配置项改为 LLM_MODELS 列表，同时启动多个模型 - 将 wiki 纳入 samples 知识库依赖变化： - 指定 streamlit~=1.27.0。1.26.0会报rerun错误，1.28.0会有无限刷新错误修复优化： - 优化 get_default_llm_model 逻辑 - 适配 Qwen 在线 API 做 Embeddings 时最大 25 行的限制 - 列出知识库磁盘文件时跳过 . 开头的文件	2023-11-09 22:15:52 +08:00
zR	57612d5232	修复一些bug (#1965 ) * 修改一些bug * 更新掉了一部分之前的bug	2023-11-03 18:56:27 +08:00
qiankunli	fa906b33a8	添加对话评分与历史消息保存功能 (#1940 ) * 新功能： - WEBUI 添加对话评分功能 - 增加 /chat/feedback 接口，用于接收对话评分 - /chat/chat 接口返回值由 str 改为 {"text":str, "chat_history_id": str} - init_database.py 添加 --create-tables --clear-tables 参数依赖： - streamlit-chatbox==1.1.11 开发者： - ChatHistoryModel 的 id 字段支持自动生成 - SAVE_CHAT_HISTORY 改到 basic_config.py * 修复：点击反馈后页面未刷新 --------- Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> Co-authored-by: liunux4odoo <liunux@qq.com> Co-authored-by: liunux4odoo <41217877+liunux4odoo@users.noreply.github.com>	2023-11-03 11:31:45 +08:00
liunux4odoo	d8e15b57ba	知识库支持子目录（不包括temp和tmp开头的目录），文件相对路径总长度不可超过255 (#1928 )	2023-10-31 16:59:40 +08:00
liunux4odoo	65592a45c3	支持在线 Embeddings, Lite 模式支持所有知识库相关功能 (#1924 ) 新功能： - 支持在线 Embeddings：zhipu-api, qwen-api, minimax-api, qianfan-api - API 增加 /other/embed_texts 接口 - init_database.py 增加 --embed-model 参数，可以指定使用的嵌入模型（本地或在线均可） - 对于 FAISS 知识库，支持多向量库，默认位置：{KB_PATH}/vector_store/{embed_model} - Lite 模式支持所有知识库相关功能。此模式下最主要的限制是： - 不能使用本地 LLM 和 Embeddings 模型 - 知识库不支持 PDF 文件 - init_database.py 重建知识库时不再默认情况数据库表，增加 clear-tables 参数手动控制。 - API 和 WEBUI 中 score_threshold 参数范围改为 [0, 2]，以更好的适应在线嵌入模型问题修复： - API 中 list_config_models 会删除 ONLINE_LLM_MODEL 中的敏感信息，导致第二轮API请求错误开发者： - 统一向量库的识别：以（kb_name,embed_model）为判断向量库唯一性的依据，避免 FAISS 知识库缓存加载逻辑错误 - KBServiceFactory.get_service_by_name 中添加 default_embed_model 参数，用于在构建新知识库时设置 embed_model - 优化 kb_service 中 Embeddings 操作： - 统一加载接口： server.utils.load_embeddings，利用全局缓存避免各处 Embeddings 传参 - 统一文本嵌入接口：server.knowledge_base.kb_service.base.[embed_texts, embed_documents] - 重写 normalize 函数，去除对 scikit-learn/scipy 的依赖	2023-10-31 14:26:50 +08:00
zR	aa7c580974	Dev (#1902 ) 修改Agent的内容	2023-10-27 22:53:43 +08:00
zR	bb72d9ac26	支持GLM (#1896 ) * 支持glm3	2023-10-27 17:56:27 +08:00
zR	24d1e28a07	一些细节优化 (#1891 ) Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-27 11:52:44 +08:00
liunux4odoo	b4c68ddd05	优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式 (#1886 ) * 优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式新功能 - 智谱AI、Minimax、千帆、千问 4 个在线模型支持 embeddings（不通过Fastchat，后续会单独提供相关api接口） - 在线模型自动检测传入参数，在传入非 messages 格式的 prompt 时，自动转换为 completion 形式，以支持 completion 接口开发者： - 重构ApiModelWorker: - 所有在线 API 请求封装到 do_chat 方法：自动传入参数 ApiChatParams，简化参数与配置项的获取；自动处理与fastchat的接口 - 加强 API 请求错误处理，返回更有意义的信息 - 改用 qianfan sdk 重写 qianfan-api - 将所有在线模型的测试用例统一在一起，简化测试用例编写 * Delete requirements_langflow.txt	2023-10-26 22:44:48 +08:00
liunux4odoo	03e55e11c4	支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860 ) * move get_default_llm_model from webui to ApiRequest 增加API接口及其测试用例： - /server/get_prompt_template: 获取服务器配置的 prompt 模板 - 增加知识库多线程访问测试用例支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 * fix bug in server.api --------- Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>	2023-10-25 08:30:23 +08:00
Zhi-guo Huang	be67ea43d8	Merge pull request #1828 from qiankunli/feat/add-completion-api 增加completion功能的API接口，注意暂不支持online_api模型	2023-10-24 22:10:54 +08:00
liqiankun.1111	b002a2879b	feat: add completion api	2023-10-22 17:07:26 +08:00
zR	1b50547e60	Dev (#1822 ) * 支持了agentlm * 支持了agentlm和相关提示词 * 修改了Agent的一些功能，加入了Embed方面的一个优化 --------- Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-22 00:00:15 +08:00
liunux4odoo	d316efe8d3	release 0.2.6 (#1815 ) ## 🛠 新增功能 - 支持百川在线模型 (@hzg0601 @liunux4odoo in #1623) - 支持 Azure OpenAI 与 claude 等 Langchain 自带模型 (@zRzRzRzRzRzRzR in #1808) - Agent 功能大量更新，支持更多的工具、更换提示词、检索知识库 (@zRzRzRzRzRzRzR in #1626 #1666 #1785) - 加长 32k 模型的历史记录 (@zRzRzRzRzRzRzR in #1629 #1630) - _chat 接口支持 max_tokens 参数 (@liunux4odoo in #1744) - 实现 API 和 WebUI 的前后端分离 (@liunux4odoo in #1772) - 支持 zlilliz 向量库 (@zRzRzRzRzRzRzR in #1785) - 支持 metaphor 搜索引擎 (@liunux4odoo in #1792) - 支持 p-tuning 模型 (@hzg0601 in #1810) - 更新完善文档和 Wiki (@imClumsyPanda @zRzRzRzRzRzRzR @glide-the in #1680 #1811) ## 🐞 问题修复 - 修复 bge- 模型匹配超过 1 的问题 (@zRzRzRzRzRzRzR in #1652) - 修复系统代理为空的问题 (@glide-the in #1654) - 修复重建知识库时 `d == self.d assert error` (@liunux4odoo in #1766) - 修复对话历史消息错误 (@liunux4odoo in #1801) - 修复 OpenAI 无法调用的 bug (@zRzRzRzRzRzRzR in #1808) - 修复 windows下 BIND_HOST=0.0.0.0 时对话出错的问题 (@hzg0601 in #1810)	2023-10-20 23:16:06 +08:00
liunux4odoo	d053950aee	新功能： (#1801 ) - 更新langchain/fastchat依赖，添加xformers依赖 - 默认max_tokens=None, 生成tokens自动为模型支持的最大值修复： - history_len=0 时会带入1条不完整的历史消息，导致LLM错误 - 当对话轮数达到history_len时，传入的历史消息为空	2023-10-19 22:09:15 +08:00
liunux4odoo	b9b42991f6	- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文） - 增加默认知识库和默认搜索引擎的配置项 - 修复WEBUI弹出当前模型错误	2023-10-18 23:02:20 +08:00
zR	69e5da4e7a	北京黑客松更新 (#1785 ) * 北京黑客松更新知识库支持：支持zilliz数据库 Agent支持：支持以下工具调用 1. 支持互联网Agent调用 2. 支持知识库Agent调用 3. 支持旅游助手工具(未上传）知识库更新 1. 支持知识库简介，用于Agent选择 2. UI对应知识库简介提示词选择 1. UI 和模板支持提示词模板更换选择	2023-10-18 15:19:02 +08:00
liunux4odoo	9ce328fea9	实现Api和WEBUI的前后端分离 (#1772 ) * update ApiRequest: 删除no_remote_api本地调用模式；支持同步/异步调用 * 实现API和WEBUI的分离： - API运行服务器上的配置通过/llm_model/get_model_config、/server/configs接口提供，WEBUI运行机器上的配置项仅作为代码内部默认值使用 - 服务器可用的搜索引擎通过/server/list_search_engines提供 - WEBUI可选LLM列表中只列出在FSCHAT_MODEL_WORKERS中配置的模型 - 修改WEBUI中默认LLM_MODEL获取方式，改为从api端读取 - 删除knowledge_base_chat中`local_doc_url`参数其它修改： - 删除多余的kb_config.py.exmaple(名称错误) - server_config中默认关闭vllm - server_config中默认注释除智谱AI之外的在线模型 - 修改requests从系统获取的代理，避免model worker注册错误 * 修正： - api.list_config_models返回模型原始配置 - api.list_config_models和api.get_model_config中过滤online api模型的敏感信息 - 将GPT等直接访问的模型列入WEBUI可选模型列表其它： - 指定langchain==0.3.313, fschat==0.2.30, langchain-experimental==0.0.30	2023-10-17 16:52:07 +08:00
liunux4odoo	cd748128c3	add paramter `max_tokens` to 4 chat api with default value 1024 (#1744 )	2023-10-12 16:18:56 +08:00
zR	2c8fc95f7a	Agent大更新合并 (#1666 ) * 更新上agent提示词代码 * 更新部分文档，修复了issue中提到的bge匹配超过1 的bug * 按需修改 * 解决了部分最新用户用依赖的bug，加了两个工具，移除google工具 * Agent大幅度优化 1. 修改了UI界面 (1)高亮所有没有进行agent对齐的模型， (2)优化输出体验和逻辑，使用markdown 2. 降低天气工具使用门槛 3. 依赖更新 (1) vllm 更新到0.2.0，增加了一些参数 (2) torch 建议更新到2.1 (3)pydantic不要更新到1.10.12	2023-10-07 11:26:11 +08:00
liunux4odoo	ba8d0f8e17	发版：v0.2.5 (#1620 ) * 优化configs (#1474) * remove llm_model_dict * optimize configs * fix get_model_path * 更改一些默认参数，添加千帆的默认配置 * Update server_config.py.example * fix merge conflict for #1474 (#1494) * 修复ChatGPT api_base_url错误；用户可以在model_config在线模型配置中覆盖默认的api_base_url (#1496) * 优化LLM模型列表获取、切换的逻辑： (#1497) 1、更准确的获取未运行的可用模型 2、优化WEBUI模型列表显示与切换的控制逻辑 * 更新migrate.py和init_database.py，加强知识库迁移工具： (#1498) 1. 添加--update-in-db参数，按照数据库信息，从本地文件更新向量库 2. 添加--increament参数，根据本地文件增量更新向量库 3. 添加--prune-db参数，删除本地文件后，自动清理相关的向量库 4. 添加--prune-folder参数，根据数据库信息，清理无用的本地文件 5. 取消--update-info-only参数。数据库中存储了向量库信息，该操作意义不大 6. 添加--kb-name参数，所有操作支持指定操作的知识库，不指定则为所有本地知识库 7. 添加知识库迁移的测试用例 8. 删除milvus_kb_service的save_vector_store方法 * feat: support volc fangzhou * 使火山方舟正常工作，添加错误处理和测试用例 * feat: support volc fangzhou (#1501) * feat: support volc fangzhou --------- Co-authored-by: liunux4odoo <41217877+liunux4odoo@users.noreply.github.com> Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> * 第一版初步agent实现 (#1503) * 第一版初步agent实现 * 增加steaming参数 * 修改了weather.py --------- Co-authored-by: zR <zRzRzRzRzRzRzR> * 添加configs/prompt_config.py，允许用户自定义prompt模板： (#1504) 1、默认包含2个模板，分别用于LLM对话，知识库和搜索引擎对话 2、 server/utils.py提供函数get_prompt_template，获取指定的prompt模板内容（支持热加载） 3、 api.py中chat/knowledge_base_chat/search_engine_chat接口支持prompt_name参数 * 增加其它模型的参数适配 * 增加传入矢量名称加载 * 1. 搜索引擎问答支持历史记录； 2. 修复知识库问答历史记录传参错误：用户输入被传入history，问题出在webui中重复获取历史消息，api知识库对话接口并无问题。 * langchain日志开关 * move wrap_done & get_ChatOpenAI from server.chat.utils to server.utils (#1506) * 修复faiss_pool知识库缓存key错误 (#1507) * fix ReadMe anchor link (#1500) * fix : Duplicate variable and function name (#1509) Co-authored-by: Jim <zhangpengyi@taijihuabao.com> * Update README.md * fix #1519: streamlit-chatbox旧版BUG，但新版有兼容问题，先在webui中作处理，并限定chatbox版本 (#1525) close #1519 * 【功能新增】在线 LLM 模型支持阿里云通义千问 (#1534) * feat: add qwen-api * 使Qwen API支持temperature参数；添加测试用例 * 将online-api的sdk列为可选依赖 --------- Co-authored-by: liunux4odoo <liunux@qq.com> * 处理序列化至磁盘的逻辑 * remove depends on volcengine * update kb_doc_api: use Form instead of Body when upload file * 将所有httpx请求改为使用Client，提高效率，方便以后设置代理等。 (#1554) 将所有httpx请求改为使用Client，提高效率，方便以后设置代理等。将本项目相关服务加入无代理列表，避免fastchat的服务器请求错误。(windows下无效) * update QR code * update readme_en,readme,requirements_api,requirements,model_config.py.example:测试baichuan2-7b;更新相关文档 * 新增特性：1.支持vllm推理加速框架；2. 更新支持模型列表 * 更新文件：1. startup,model_config.py.example,serve_config.py.example,FAQ * 1. debug vllm加速框架完毕；2. 修改requirements,requirements_api对vllm的依赖；3.注释掉serve_config中baichuan-7b的device为cpu的配置 * 1. 更新congif中关于vllm后端相关说明；2. 更新requirements，requirements_api; * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 (#1611) * Dev (#1613) * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 * issue提到的一个bug * 温度最小改成0，但是不应该支持负数 * 修改了最小的温度 * fix: set vllm based on platform to avoid error on windows * fix: langchain warnings for import from root * 修复webui中重建知识库以及对话界面UI错误 (#1615) * 修复bug:webui点重建知识库时，如果存在不支持的文件会导致整个接口错误;migrate中没有导入CHUNK_SIZE * 修复：webui对话界面的expander一直为running状态；简化历史消息获取方法 * 根据官方文档，添加对英文版的bge embedding的指示模板 (#1585) Co-authored-by: zR <2448370773@qq.com> * Dev (#1618) * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 * issue提到的一个bug * 温度最小改成0，但是不应该支持负数 * 修改了最小的温度 * 增加了部分Agent支持和修改了启动文件的部分bug * 修改了GPU数量配置文件 * 1 1 * 修复配置文件错误 * 更新readme，稳定测试 * 更改readme 0928 (#1619) * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 * issue提到的一个bug * 温度最小改成0，但是不应该支持负数 * 修改了最小的温度 * 增加了部分Agent支持和修改了启动文件的部分bug * 修改了GPU数量配置文件 * 1 1 * 修复配置文件错误 * 更新readme，稳定测试 * 更新readme * fix readme * 处理序列化至磁盘的逻辑 * update version number to v0.2.5 --------- Co-authored-by: qiankunli <qiankun.li@qq.com> Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> Co-authored-by: zR <2448370773@qq.com> Co-authored-by: glide-the <2533736852@qq.com> Co-authored-by: Water Zheng <1499383852@qq.com> Co-authored-by: Jim Zhang <dividi_z@163.com> Co-authored-by: Jim <zhangpengyi@taijihuabao.com> Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com> Co-authored-by: Leego <leegodev@hotmail.com> Co-authored-by: hzg0601 <hzg0601@163.com> Co-authored-by: WilliamChen-luckbob <58684828+WilliamChen-luckbob@users.noreply.github.com>	2023-09-28 23:30:21 +08:00
zR	efd8edda16	Dev (#1618 ) * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 * issue提到的一个bug * 温度最小改成0，但是不应该支持负数 * 修改了最小的温度 * 增加了部分Agent支持和修改了启动文件的部分bug * 修改了GPU数量配置文件 * 1 1 * 修复配置文件错误 * 更新readme，稳定测试	2023-09-28 20:19:26 +08:00
liunux4odoo	8d0f8a5d67	fix: langchain warnings for import from root	2023-09-27 21:55:02 +08:00
zR	d39878ff35	Dev (#1613 ) * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 * issue提到的一个bug * 温度最小改成0，但是不应该支持负数 * 修改了最小的温度	2023-09-27 21:17:50 +08:00

1 2 3

104 Commits