Langchain-Chatchat

Commit Graph

Author	SHA1	Message	Date
hzg0601	1fac51fe35	temporarily save faiss_cache	2023-12-06 09:45:56 +00:00
liunux4odoo	67b7c99d03	ocr 支持 GPU 加速（需要手动安装 rapidocr_paddle[gpu])；知识库支持 MHTML 和 Evernote 文件。 (#2265 ) 在 requirements 和 Wiki 中增加对可选文档加载器 SDK 的说明 ( close #2264 )	2023-12-04 09:39:56 +08:00
liunux4odoo	7d2de47bcf	文件对话和知识库对话 API 接口实现全异步操作，防止阻塞 (#2256 ) * EmbeddingFunAdapter 支持异步操作；文件对话和知识库对话 API 接口实现全异步操作，防止阻塞 * 修复：使 list_files_from_folder 返回相对路径	2023-12-02 19:22:44 +08:00
liunux4odoo	509dee0425	fix: empty docs error in KnowledgeFile	2023-11-29 11:33:43 +08:00
glide-the	279ffdf117	单个知识库根据doc_ids摘要	2023-11-25 23:31:13 +08:00
glide-the	248db46187	Merge branch 'dev_summary' into dev_command_summary 实现summary_chunk 文档分段总结业务实现使用 MapReduceDocumentsChain 生成摘要 # Conflicts: # server/api.py # server/knowledge_base/kb_doc_api.py # server/knowledge_base/kb_service/base.py # server/knowledge_base/migrate.py	2023-11-25 22:30:41 +08:00
glide-the	f57837c07a	Merge branch 'dev_summary' into dev_tmp # Conflicts: # server/api.py # server/knowledge_base/kb_doc_api.py # server/knowledge_base/kb_service/base.py # server/knowledge_base/migrate.py	2023-11-25 21:02:46 +08:00
zR	1b0cf67a57	支持软连接的知识库 (#2167 ) * GLM3支持传入提示词支持传入提示词的Agent ChatGLM3-6B * 软连接处理 1. 有效的软连接处理，参考了 #2125 2. 更新了依赖，现在fschat原生支持GLM3的全功能 * 更新了支持的模型列表和依赖 1. 推荐用户使用GLM3-6B取代2代GLM模型 2. 推荐用户使用性能更强的bge模型 3 推荐使用vllm和torch的最新稳定版本	2023-11-24 22:47:55 +08:00
liunux4odoo	aae4144476	数据库和向量库中文档 metadata["source"] 改为相对路径，便于向量库迁移 (#2153 ) 修复： - 上传知识库文件名称包括子目录时，自动创建子目录	2023-11-23 19:54:00 +08:00
qiankunli	1c97673d41	feat: add db memory (#2046 ) * feat: add db memory * WEBUI 添加多会话功能 --------- Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> Co-authored-by: liunux4odoo <liunux@qq.com>	2023-11-22 18:38:26 +08:00
liunux4odoo	3cf7422c21	修复：知识库json文件的中文被转为unicode码，导致无法匹配 (#2128 )	2023-11-21 21:00:46 +08:00
liunux4odoo	ad7a6fd438	开发者： (#2091 ) - 修复列出知识库磁盘文件时跳过临时文件的bug：只有目录被排除了，文件未排除 - 优化知识库文档加载器： - 将 elements 模式改为 single 模式，避免文档被切分得太碎 - 给 get_loader 和 KnowledgeFile 增加 loader_kwargs 参数，可以自定义文档加载器参数	2023-11-17 11:39:32 +08:00
liunux4odoo	68a544ea33	开发者：XXKBService.get_doc_by_id 改为批量处理，提高访问向量库效率。	2023-11-16 11:09:40 +08:00
liunux4odoo	fbe214471b	知识库支持 .jsonl, .epub, .xlsx, .xlsd, .ipynb, .odt, .py, .srt, .toml, .doc, .ppt 文件 (#2079 ) * 知识库支持行式 json 文件如果要使用 json 文件，需要 `conda install jq`（windows 下 pip install jq 会失败）开发者：删除 CustomJsonLoader，使用 langchain 自带的 JsonLoader 处理 json 文件，添加 JsonLinesLoader 处理 jsonl 文件。 * 知识库支持 .epub, .xlsx, .xlsd, .ipynb, .odt, .py, .srt, .toml, .doc, .ppt 文件为 .eml, .msg, .rst, .rtf, .tsv, .docx, .xml, .pptx 指定专用加载器	2023-11-16 09:37:09 +08:00
liunux4odoo	3b3d948d27	添加文件对话模式 (#2071 ) 开发者： - 添加 /chat/file_chat, /knowledge_base/upload_temp_docs API 接口 - 添加 CACHED_MEMO_VS_NUM, BASE_TEMP_DIR 配置项	2023-11-16 07:39:27 +08:00
zR	94d4304638	更新了chatglm3 6b agent的文档，提示词 (#2041 ) 更新了chatglm3 6b agent的文档，提示词修复代理no_proxy格式问题 #1838 的问题，感谢多次复现和验证修改了pg清理知识库后还会引用之前知识库的问题	2023-11-13 16:30:09 +08:00
hzg0601	c1440c2609	增加ElasticSearch支持	2023-11-10 16:04:41 +08:00
liunux4odoo	b51ba11f45	支持通过配置项同时启动多个模型，将Wiki纳入samples知识库 (#2002 ) 新功能： - 将 LLM_MODEL 配置项改为 LLM_MODELS 列表，同时启动多个模型 - 将 wiki 纳入 samples 知识库依赖变化： - 指定 streamlit~=1.27.0。1.26.0会报rerun错误，1.28.0会有无限刷新错误修复优化： - 优化 get_default_llm_model 逻辑 - 适配 Qwen 在线 API 做 Embeddings 时最大 25 行的限制 - 列出知识库磁盘文件时跳过 . 开头的文件	2023-11-09 22:15:52 +08:00
WilliamChen-luckbob	ce1001a043	bugfix:dev分支创建知识库必然失败的bug修复 (#1980 ) * bugfix:dev分支创建知识库必然失败的bug修复 * 统一 KBServiceFactory.get_service_by_name 的逻辑，数据库中不存在知识库时返回 None --------- Co-authored-by: liunux4odoo <liunux@qq.com>	2023-11-09 17:45:21 +08:00
imClumsyPanda	e233e4f220	reformat server/knowledge_base/migrate.py	2023-11-06 22:49:35 +08:00
imClumsyPanda	fb32c31a70	reformat kb_doc_api.py	2023-11-06 22:44:50 +08:00
zR	57612d5232	修复一些bug (#1965 ) * 修改一些bug * 更新掉了一部分之前的bug	2023-11-03 18:56:27 +08:00
qiankunli	fa906b33a8	添加对话评分与历史消息保存功能 (#1940 ) * 新功能： - WEBUI 添加对话评分功能 - 增加 /chat/feedback 接口，用于接收对话评分 - /chat/chat 接口返回值由 str 改为 {"text":str, "chat_history_id": str} - init_database.py 添加 --create-tables --clear-tables 参数依赖： - streamlit-chatbox==1.1.11 开发者： - ChatHistoryModel 的 id 字段支持自动生成 - SAVE_CHAT_HISTORY 改到 basic_config.py * 修复：点击反馈后页面未刷新 --------- Co-authored-by: liqiankun.1111 <liqiankun.1111@bytedance.com> Co-authored-by: liunux4odoo <liunux@qq.com> Co-authored-by: liunux4odoo <41217877+liunux4odoo@users.noreply.github.com>	2023-11-03 11:31:45 +08:00
liunux4odoo	554122f60e	Feat (#1951 ) * 知识库支持子目录（不包括temp和tmp开头的目录），文件相对路径总长度不可超过255 * init_database.py 增加 --import-db 参数，在版本升级时，如果 info.db 表结构发生变化，但向量库无需重建，可以在重建数据库后，使用本参数从旧的数据库中导入信息	2023-11-02 14:46:39 +08:00
liunux4odoo	d8e15b57ba	知识库支持子目录（不包括temp和tmp开头的目录），文件相对路径总长度不可超过255 (#1928 )	2023-10-31 16:59:40 +08:00
liunux4odoo	65592a45c3	支持在线 Embeddings, Lite 模式支持所有知识库相关功能 (#1924 ) 新功能： - 支持在线 Embeddings：zhipu-api, qwen-api, minimax-api, qianfan-api - API 增加 /other/embed_texts 接口 - init_database.py 增加 --embed-model 参数，可以指定使用的嵌入模型（本地或在线均可） - 对于 FAISS 知识库，支持多向量库，默认位置：{KB_PATH}/vector_store/{embed_model} - Lite 模式支持所有知识库相关功能。此模式下最主要的限制是： - 不能使用本地 LLM 和 Embeddings 模型 - 知识库不支持 PDF 文件 - init_database.py 重建知识库时不再默认情况数据库表，增加 clear-tables 参数手动控制。 - API 和 WEBUI 中 score_threshold 参数范围改为 [0, 2]，以更好的适应在线嵌入模型问题修复： - API 中 list_config_models 会删除 ONLINE_LLM_MODEL 中的敏感信息，导致第二轮API请求错误开发者： - 统一向量库的识别：以（kb_name,embed_model）为判断向量库唯一性的依据，避免 FAISS 知识库缓存加载逻辑错误 - KBServiceFactory.get_service_by_name 中添加 default_embed_model 参数，用于在构建新知识库时设置 embed_model - 优化 kb_service 中 Embeddings 操作： - 统一加载接口： server.utils.load_embeddings，利用全局缓存避免各处 Embeddings 传参 - 统一文本嵌入接口：server.knowledge_base.kb_service.base.[embed_texts, embed_documents] - 重写 normalize 函数，去除对 scikit-learn/scipy 的依赖	2023-10-31 14:26:50 +08:00
liunux4odoo	deed92169f	支持在线 Embeddings：zhipu-api, qwen-api, minimax-api, qianfan-api (#1907 ) * 新功能： - 支持在线 Embeddings：zhipu-api, qwen-api, minimax-api, qianfan-api - API 增加 /other/embed_texts 接口 - init_database.py 增加 --embed-model 参数，可以指定使用的嵌入模型（本地或在线均可）问题修复： - API 中 list_config_models 会删除 ONLINE_LLM_MODEL 中的敏感信息，导致第二轮API请求错误开发者： - 优化 kb_service 中 Embeddings 操作： - 统一加载接口： server.utils.load_embeddings，利用全局缓存避免各处 Embeddings 传参 - 统一文本嵌入接口：server.embedding_api.[embed_texts, embed_documents]	2023-10-28 23:37:30 +08:00
zR	aa7c580974	Dev (#1902 ) 修改Agent的内容	2023-10-27 22:53:43 +08:00
zR	24d1e28a07	一些细节优化 (#1891 ) Co-authored-by: zR <zRzRzRzRzRzRzR>	2023-10-27 11:52:44 +08:00
liunux4odoo	b4c68ddd05	优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式 (#1886 ) * 优化在线 API ，支持 completion 和 embedding，简化在线 API 开发方式新功能 - 智谱AI、Minimax、千帆、千问 4 个在线模型支持 embeddings（不通过Fastchat，后续会单独提供相关api接口） - 在线模型自动检测传入参数，在传入非 messages 格式的 prompt 时，自动转换为 completion 形式，以支持 completion 接口开发者： - 重构ApiModelWorker: - 所有在线 API 请求封装到 do_chat 方法：自动传入参数 ApiChatParams，简化参数与配置项的获取；自动处理与fastchat的接口 - 加强 API 请求错误处理，返回更有意义的信息 - 改用 qianfan sdk 重写 qianfan-api - 将所有在线模型的测试用例统一在一起，简化测试用例编写 * Delete requirements_langflow.txt	2023-10-26 22:44:48 +08:00
zR	e74fe2d950	Zilliz修复 (#1874 ) * 修复zilliz的问题	2023-10-25 21:59:26 +08:00
liunux4odoo	19f5f07d57	fix: unused imported faiss in milvus_kb_server (close #1849 )	2023-10-24 15:01:19 +08:00
zR	a036e3ccda	修改了部分Agent Prompt 修改了一些适配问题 (#1839 ) * 支持了agentlm * 支持了agentlm和相关提示词 * 修改了Agent的一些功能，加入了Embed方面的一个优化 * 修改了部分Agent的工具 * 增加一些Langchain的自带工具 * 修复一些兼容性的bug	2023-10-23 14:53:14 +08:00
zR	e920cd0064	合并分支，支持 (#1808 ) * 北京黑客松更新知识库支持：支持zilliz数据库 Agent支持：支持以下工具调用 1. 支持互联网Agent调用 2. 支持知识库Agent调用 3. 支持旅游助手工具(未上传）知识库更新 1. 支持知识库简介，用于Agent选择 2. UI对应知识库简介提示词选择 1. UI 和模板支持提示词模板更换选择 * 数据库更新介绍问题解决 * 关于Langchain自己支持的模型 1. 修复了Openai无法调用的bug 2. 支持了Azure Openai Claude模型（在模型切换界面由于优先级问题，显示的会是其他联网模型) 3. 422问题被修复，用了另一种替代方案。 4. 更新了部分依赖	2023-10-20 18:13:55 +08:00
liunux4odoo	b9b42991f6	- 支持metaphor搜索引擎（无需代理，key申请简单，目前不支持中文） - 增加默认知识库和默认搜索引擎的配置项 - 修复WEBUI弹出当前模型错误	2023-10-18 23:02:20 +08:00
zR	69e5da4e7a	北京黑客松更新 (#1785 ) * 北京黑客松更新知识库支持：支持zilliz数据库 Agent支持：支持以下工具调用 1. 支持互联网Agent调用 2. 支持知识库Agent调用 3. 支持旅游助手工具(未上传）知识库更新 1. 支持知识库简介，用于Agent选择 2. UI对应知识库简介提示词选择 1. UI 和模板支持提示词模板更换选择	2023-10-18 15:19:02 +08:00
liunux4odoo	94977c7ab1	修复：切换embed_model时，FAISS向量库未正确释放，导致`d == self.d assert (#1766 ) 修复： - 切换embed_model时，FAISS向量库未正确释放，导致d == self.d assert error (close [求助] 初始化知识库发生错误 #1657 ) - ApiRequest中chat接口增加max_tokens参数 - FileDocModel模型字段错误(字段错误 #1691)	2023-10-16 21:02:07 +08:00
zR	77d38db00e	修改部分错误的文档，加长了历史记录（for 32k Models） (#1629 ) * 更新上agent提示词代码 * 更新部分文档，修复了issue中提到的bge匹配超过1 的bug * 按需修改	2023-09-29 20:17:29 +08:00
WilliamChen-luckbob	8fa99026c8	根据官方文档，添加对英文版的bge embedding的指示模板 (#1585 ) Co-authored-by: zR <2448370773@qq.com>	2023-09-28 19:18:31 +08:00
liunux4odoo	b3c7f8b072	修复webui中重建知识库以及对话界面UI错误 (#1615 ) * 修复bug:webui点重建知识库时，如果存在不支持的文件会导致整个接口错误;migrate中没有导入CHUNK_SIZE * 修复：webui对话界面的expander一直为running状态；简化历史消息获取方法	2023-09-28 15:12:03 +08:00
zR	d39878ff35	Dev (#1613 ) * 增加了仅限GPT4的agent功能，陆续补充，中文版readme已写 * issue提到的一个bug * 温度最小改成0，但是不应该支持负数 * 修改了最小的温度	2023-09-27 21:17:50 +08:00
imClumsyPanda	f3042a6a29	merge master	2023-09-22 12:36:45 +08:00
peterz3g	3ff130ecc2	修复csv文件解析编码报错的问题。 (#1508 )	2023-09-21 14:41:49 +08:00
liunux4odoo	818cb1a491	update kb_doc_api: use Form instead of Body when upload file	2023-09-21 09:57:36 +08:00
glide-the	0586f94c5a	summary_chunk 文档分段总结业务实现使用 MapReduceDocumentsChain 生成摘要	2023-09-20 23:55:56 +08:00
glide-the	bd0164ea62	处理序列化至磁盘的逻辑	2023-09-20 21:35:23 +08:00
Jim Zhang	cb2b560a5b	fix : Duplicate variable and function name (#1509 ) Co-authored-by: Jim <zhangpengyi@taijihuabao.com>	2023-09-20 16:46:31 +08:00
Jim Zhang	59fb309ba4	fix : Duplicate variable and function name (#1509 ) Co-authored-by: Jim <zhangpengyi@taijihuabao.com>	2023-09-18 11:00:04 +08:00
liunux4odoo	1bae930691	修复faiss_pool知识库缓存key错误 (#1507 )	2023-09-17 16:31:44 +08:00
glide-the	902ba0c321	增加传入矢量名称加载	2023-09-17 13:56:18 +08:00

1 2 3 4

161 Commits