Langchain-Chatchat

Commit Graph

Author	SHA1	Message	Date
glide-the	248db46187	Merge branch 'dev_summary' into dev_command_summary 实现summary_chunk 文档分段总结业务实现使用 MapReduceDocumentsChain 生成摘要 # Conflicts: # server/api.py # server/knowledge_base/kb_doc_api.py # server/knowledge_base/kb_service/base.py # server/knowledge_base/migrate.py	2023-11-25 22:30:41 +08:00
glide-the	f57837c07a	Merge branch 'dev_summary' into dev_tmp # Conflicts: # server/api.py # server/knowledge_base/kb_doc_api.py # server/knowledge_base/kb_service/base.py # server/knowledge_base/migrate.py	2023-11-25 21:02:46 +08:00
liunux4odoo	1de4258aa0	给 ApiModelWorker 添加 logger 成员变量，API请求出错时输出有意义的错误信息。 (#2169 ) * 给 ApiModelWorker 添加 logger 成员变量，API请求出错时输出有意义的错误信息。 /chat/chat 接口 conversation_id参数改为默认 ""，避免 swagger 页面默认值错误导致历史消息失效 * 修复在线模型一些bug	2023-11-25 13:51:07 +08:00
zR	1b0cf67a57	支持软连接的知识库 (#2167 ) * GLM3支持传入提示词支持传入提示词的Agent ChatGLM3-6B * 软连接处理 1. 有效的软连接处理，参考了 #2125 2. 更新了依赖，现在fschat原生支持GLM3的全功能 * 更新了支持的模型列表和依赖 1. 推荐用户使用GLM3-6B取代2代GLM模型 2. 推荐用户使用性能更强的bge模型 3 推荐使用vllm和torch的最新稳定版本	2023-11-24 22:47:55 +08:00
Eden	dfcebf7bc3	支持昆仑万维天工大模型 (#2166 ) --------- Co-authored-by: Eden <chuangqi.huang@ubtrobot.com> Co-authored-by: liunux4odoo <liunux@qq.com>	2023-11-24 22:25:35 +08:00
liunux4odoo	824c29a6d2	将 MiniMax 和千帆在线 Embedding 改为 10 个文本一批，防止接口数量限制 (#2161 )	2023-11-24 16:42:20 +08:00
liunux4odoo	1b9b777eaf	使 MessageModel 中 conversation_id 为非必填项，避免前端请求错误	2023-11-23 21:42:27 +08:00
liunux4odoo	aae4144476	数据库和向量库中文档 metadata["source"] 改为相对路径，便于向量库迁移 (#2153 ) 修复： - 上传知识库文件名称包括子目录时，自动创建子目录	2023-11-23 19:54:00 +08:00
qiankunli	1c97673d41	feat: add db memory (#2046 ) * feat: add db memory * WEBUI 添加多会话功能 --------- Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> Co-authored-by: liunux4odoo <liunux@qq.com>	2023-11-22 18:38:26 +08:00
glide-the	17c9632942	统一在线模型异常报文、增加详细日志	2023-11-21 21:47:02 +08:00
liunux4odoo	3cf7422c21	修复：知识库json文件的中文被转为unicode码，导致无法匹配 (#2128 )	2023-11-21 21:00:46 +08:00
liunux4odoo	ad7a6fd438	开发者： (#2091 ) - 修复列出知识库磁盘文件时跳过临时文件的bug：只有目录被排除了，文件未排除 - 优化知识库文档加载器： - 将 elements 模式改为 single 模式，避免文档被切分得太碎 - 给 get_loader 和 KnowledgeFile 增加 loader_kwargs 参数，可以自定义文档加载器参数	2023-11-17 11:39:32 +08:00
liunux4odoo	68a544ea33	开发者：XXKBService.get_doc_by_id 改为批量处理，提高访问向量库效率。	2023-11-16 11:09:40 +08:00
liunux4odoo	fbe214471b	知识库支持 .jsonl, .epub, .xlsx, .xlsd, .ipynb, .odt, .py, .srt, .toml, .doc, .ppt 文件 (#2079 ) * 知识库支持行式 json 文件如果要使用 json 文件，需要 `conda install jq`（windows 下 pip install jq 会失败）开发者：删除 CustomJsonLoader，使用 langchain 自带的 JsonLoader 处理 json 文件，添加 JsonLinesLoader 处理 jsonl 文件。 * 知识库支持 .epub, .xlsx, .xlsd, .ipynb, .odt, .py, .srt, .toml, .doc, .ppt 文件为 .eml, .msg, .rst, .rtf, .tsv, .docx, .xml, .pptx 指定专用加载器	2023-11-16 09:37:09 +08:00
liunux4odoo	3b3d948d27	添加文件对话模式 (#2071 ) 开发者： - 添加 /chat/file_chat, /knowledge_base/upload_temp_docs API 接口 - 添加 CACHED_MEMO_VS_NUM, BASE_TEMP_DIR 配置项	2023-11-16 07:39:27 +08:00
liunux4odoo	2adfa4277c	在webui模型列表中包括：非model worker启动的在线模型（如openai-api）；已经下载的本地模型 (#2060 )	2023-11-14 21:17:32 +08:00
zR	21b079d751	GLM3支持传入提示词 (#2058 ) 支持传入提示词的Agent ChatGLM3-6B	2023-11-14 17:45:22 +08:00
liunux4odoo	e78a804ec6	close #2044 : duplicated mount_knowledge_base_routes in server/api.py	2023-11-13 20:30:32 +08:00
zR	94d4304638	更新了chatglm3 6b agent的文档，提示词 (#2041 ) 更新了chatglm3 6b agent的文档，提示词修复代理no_proxy格式问题 #1838 的问题，感谢多次复现和验证修改了pg清理知识库后还会引用之前知识库的问题	2023-11-13 16:30:09 +08:00
zR	91ff0574df	支持ChatGLM3-6B (#2021 ) * 更新依赖和配置文件中的Agent模型 * 支持基础的glm3_agent	2023-11-12 16:45:50 +08:00
hzg0601	c1440c2609	增加ElasticSearch支持	2023-11-10 16:04:41 +08:00
liunux4odoo	b51ba11f45	支持通过配置项同时启动多个模型，将Wiki纳入samples知识库 (#2002 ) 新功能： - 将 LLM_MODEL 配置项改为 LLM_MODELS 列表，同时启动多个模型 - 将 wiki 纳入 samples 知识库依赖变化： - 指定 streamlit~=1.27.0。1.26.0会报rerun错误，1.28.0会有无限刷新错误修复优化： - 优化 get_default_llm_model 逻辑 - 适配 Qwen 在线 API 做 Embeddings 时最大 25 行的限制 - 列出知识库磁盘文件时跳过 . 开头的文件	2023-11-09 22:15:52 +08:00
WilliamChen-luckbob	ce1001a043	bugfix:dev分支创建知识库必然失败的bug修复 (#1980 ) * bugfix:dev分支创建知识库必然失败的bug修复 * 统一 KBServiceFactory.get_service_by_name 的逻辑，数据库中不存在知识库时返回 None --------- Co-authored-by: liunux4odoo <liunux@qq.com>	2023-11-09 17:45:21 +08:00
imClumsyPanda	e233e4f220	reformat server/knowledge_base/migrate.py	2023-11-06 22:49:35 +08:00
imClumsyPanda	fb32c31a70	reformat kb_doc_api.py	2023-11-06 22:44:50 +08:00
imClumsyPanda	051a2e97dc	add support for Zhipu-api "chatglm-turbo"	2023-11-06 22:38:05 +08:00
zR	57612d5232	修复一些bug (#1965 ) * 修改一些bug * 更新掉了一部分之前的bug	2023-11-03 18:56:27 +08:00
qiankunli	fa906b33a8	添加对话评分与历史消息保存功能 (#1940 ) * 新功能： - WEBUI 添加对话评分功能 - 增加 /chat/feedback 接口，用于接收对话评分 - /chat/chat 接口返回值由 str 改为 {"text":str, "chat_history_id": str} - init_database.py 添加 --create-tables --clear-tables 参数依赖： - streamlit-chatbox==1.1.11 开发者： - ChatHistoryModel 的 id 字段支持自动生成 - SAVE_CHAT_HISTORY 改到 basic_config.py * 修复：点击反馈后页面未刷新 --------- Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> Co-authored-by: liunux4odoo <liunux@qq.com> Co-authored-by: liunux4odoo <41217877+liunux4odoo@users.noreply.github.com>	2023-11-03 11:31:45 +08:00
liunux4odoo	554122f60e	Feat (#1951 ) * 知识库支持子目录（不包括temp和tmp开头的目录），文件相对路径总长度不可超过255 * init_database.py 增加 --import-db 参数，在版本升级时，如果 info.db 表结构发生变化，但向量库无需重建，可以在重建数据库后，使用本参数从旧的数据库中导入信息	2023-11-02 14:46:39 +08:00
liunux4odoo	d8e15b57ba	知识库支持子目录（不包括temp和tmp开头的目录），文件相对路径总长度不可超过255 (#1928 )	2023-10-31 16:59:40 +08:00
liunux4odoo	65592a45c3	支持在线 Embeddings, Lite 模式支持所有知识库相关功能 (#1924 ) 新功能： - 支持在线 Embeddings：zhipu-api, qwen-api, minimax-api, qianfan-api - API 增加 /other/embed_texts 接口 - init_database.py 增加 --embed-model 参数，可以指定使用的嵌入模型（本地或在线均可） - 对于 FAISS 知识库，支持多向量库，默认位置：{KB_PATH}/vector_store/{embed_model} - Lite 模式支持所有知识库相关功能。此模式下最主要的限制是： - 不能使用本地 LLM 和 Embeddings 模型 - 知识库不支持 PDF 文件 - init_database.py 重建知识库时不再默认情况数据库表，增加 clear-tables 参数手动控制。 - API 和 WEBUI 中 score_threshold 参数范围改为 [0, 2]，以更好的适应在线嵌入模型问题修复： - API 中 list_config_models 会删除 ONLINE_LLM_MODEL 中的敏感信息，导致第二轮API请求错误开发者： - 统一向量库的识别：以（kb_name,embed_model）为判断向量库唯一性的依据，避免 FAISS 知识库缓存加载逻辑错误 - KBServiceFactory.get_service_by_name 中添加 default_embed_model 参数，用于在构建新知识库时设置 embed_model - 优化 kb_service 中 Embeddings 操作： - 统一加载接口： server.utils.load_embeddings，利用全局缓存避免各处 Embeddings 传参 - 统一文本嵌入接口：server.knowledge_base.kb_service.base.[embed_texts, embed_documents] - 重写 normalize 函数，去除对 scikit-learn/scipy 的依赖	2023-10-31 14:26:50 +08:00
liunux4odoo	deed92169f	支持在线 Embeddings：zhipu-api, qwen-api, minimax-api, qianfan-api (#1907 ) * 新功能： - 支持在线 Embeddings：zhipu-api, qwen-api, minimax-api, qianfan-api - API 增加 /other/embed_texts 接口 - init_database.py 增加 --embed-model 参数，可以指定使用的嵌入模型（本地或在线均可）问题修复： - API 中 list_config_models 会删除 ONLINE_LLM_MODEL 中的敏感信息，导致第二轮API请求错误开发者： - 优化 kb_service 中 Embeddings 操作： - 统一加载接口： server.utils.load_embeddings，利用全局缓存避免各处 Embeddings 传参 - 统一文本嵌入接口：server.embedding_api.[embed_texts, embed_documents]	2023-10-28 23:37:30 +08:00
zR	aa7c580974	Dev (#1902 ) 修改Agent的内容	2023-10-27 22:53:43 +08:00
zR	bb72d9ac26	支持GLM (#1896 ) * 支持glm3	2023-10-27 17:56:27 +08:00
zR	6ed87954b2	修复科大讯飞token问题和Azure的token问题 (#1894 ) Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-27 13:51:59 +08:00
liunux4odoo	b68f7fcdea	修改qianfan-api使用原始post访问，qianfan sdk无法访问	2023-10-27 13:42:16 +08:00
zR	dea468ab0f	Dev (#1892 ) * 支持了agentlm * 支持了agentlm和相关提示词 * 修改了Agent的一些功能，加入了Embed方面的一个优化 * 修改了部分Agent的工具 * 增加一些Langchain的自带工具 * 修复一些兼容性的bug * 恢复知识库 * 恢复知识库 * 1 * 修复Azure问题 * 修复zilliz的问题 * 修复Agent历史记录问题，优化知识库问答搜索的uoji * 修复讯飞大模型token问题 * 修复讯飞大模型token问题和配置文件 --------- Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-27 13:14:48 +08:00
zR	24d1e28a07	一些细节优化 (#1891 ) Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-27 11:52:44 +08:00
liunux4odoo	b4c68ddd05	优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式 (#1886 ) * 优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式新功能 - 智谱AI、Minimax、千帆、千问 4 个在线模型支持 embeddings（不通过Fastchat，后续会单独提供相关api接口） - 在线模型自动检测传入参数，在传入非 messages 格式的 prompt 时，自动转换为 completion 形式，以支持 completion 接口开发者： - 重构ApiModelWorker: - 所有在线 API 请求封装到 do_chat 方法：自动传入参数 ApiChatParams，简化参数与配置项的获取；自动处理与fastchat的接口 - 加强 API 请求错误处理，返回更有意义的信息 - 改用 qianfan sdk 重写 qianfan-api - 将所有在线模型的测试用例统一在一起，简化测试用例编写 * Delete requirements_langflow.txt	2023-10-26 22:44:48 +08:00
zR	e74fe2d950	Zilliz修复 (#1874 ) * 修复zilliz的问题	2023-10-25 21:59:26 +08:00
zR	35a7ca74c0	Azure 的fschat支持，弃用Langchain-MODEL (#1873 ) * 支持了agentlm * 支持了agentlm和相关提示词 * 修改了Agent的一些功能，加入了Embed方面的一个优化 * 修改了部分Agent的工具 * 增加一些Langchain的自带工具 * 修复一些兼容性的bug * 恢复知识库 * 恢复知识库 * 修复Azure问题	2023-10-25 21:32:40 +08:00
liunux4odoo	03e55e11c4	支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 (#1860 ) * move get_default_llm_model from webui to ApiRequest 增加API接口及其测试用例： - /server/get_prompt_template: 获取服务器配置的 prompt 模板 - 增加知识库多线程访问测试用例支持lite模式：无需安装torch等重依赖，通过在线API实现LLM对话和搜索引擎对话 * fix bug in server.api --------- Co-authored-by: imClumsyPanda <littlepanda0716@gmail.com>	2023-10-25 08:30:23 +08:00
Zhi-guo Huang	be67ea43d8	Merge pull request #1828 from qiankunli/feat/add-completion-api 增加completion功能的API接口，注意暂不支持online_api模型	2023-10-24 22:10:54 +08:00
liunux4odoo	19f5f07d57	fix: unused imported faiss in milvus_kb_server (close #1849 )	2023-10-24 15:01:19 +08:00
zR	a036e3ccda	修改了部分Agent Prompt 修改了一些适配问题 (#1839 ) * 支持了agentlm * 支持了agentlm和相关提示词 * 修改了Agent的一些功能，加入了Embed方面的一个优化 * 修改了部分Agent的工具 * 增加一些Langchain的自带工具 * 修复一些兼容性的bug	2023-10-23 14:53:14 +08:00
zR	c983e9f559	增加一些Langchain的Agent工具 (#1836 ) * 支持了agentlm * 支持了agentlm和相关提示词 * 修改了Agent的一些功能，加入了Embed方面的一个优化 * 修改了部分Agent的工具 * 增加一些Langchain的自带工具 --------- Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-23 13:22:10 +08:00
liqiankun.1111	b002a2879b	feat: add completion api	2023-10-22 17:07:26 +08:00
zR	303c9d94df	修改，格式了部分Agent工具 (#1823 ) * 支持了agentlm * 支持了agentlm和相关提示词 * 修改了Agent的一些功能，加入了Embed方面的一个优化 * 修改了部分Agent的工具 --------- Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-22 00:07:32 +08:00
zR	1b50547e60	Dev (#1822 ) * 支持了agentlm * 支持了agentlm和相关提示词 * 修改了Agent的一些功能，加入了Embed方面的一个优化 --------- Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-22 00:00:15 +08:00
zR	1c5382d96b	支持AgentLM模型 (#1821 ) * 支持了agentlm Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-21 22:09:53 +08:00

1 2 3 4 5 ...

323 Commits